IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 山东大学软件工程应用与实践——Pig代码分析(一) -> 正文阅读

[大数据]山东大学软件工程应用与实践——Pig代码分析(一)

2021SC@SDUSC


概述

执行引擎将MapReduce作业以排序顺序提交到Hadoop。这些MapReduce作业在Hadoop上执行,产生所需的结果。

AccumulatorOptimizerUtil类

addAccumulator()方法

public static void addAccumulator(PhysicalPlan plan, List<PhysicalOperator> pos) {
        if (pos == null || pos.size() == 0) {
            return;
        }
        PhysicalOperator po_package = pos.get(0);
        if (!po_package.getClass().equals(POPackage.class)) {
            return;
        }
        Packager pkgr = ((POPackage) po_package).getPkgr();
        if (!pkgr.getClass().equals(Packager.class)) {
            return;
        }
}

?if (pos == null || pos.size() == 0) {
? ? ? ? ? ? return;
? ? ? ? }

检查传入的pos是否是一个map-reduce 工程。

PhysicalOperator po_package = pos.get(0);
? ? ? ? if (!po_package.getClass().equals(POPackage.class)) {
? ? ? ? ? ? return;
? ? ? ? }

判断传入的pos的第0行的类型是否是POPackage类型。

Packager pkgr = ((POPackage) po_package).getPkgr();
? ? ? ? if (!pkgr.getClass().equals(Packager.class)) {
? ? ? ? ? ? return;
? ? ? ? }

判断po_package是否属于Packager包。

CombinerOptimizerUtil类

addCombiner方法

public static void addCombiner(PhysicalPlan mapPlan, PhysicalPlan reducePlan,
            PhysicalPlan combinePlan, CompilationMessageCollector messageCollector,
            boolean doMapAgg) throws VisitorException {
        List<PhysicalOperator> mapLeaves = mapPlan.getLeaves();
        if (mapLeaves == null || mapLeaves.size() != 1) {
            messageCollector.collect("Expected map to have single leaf", MessageType.Warning,
                    PigWarning.MULTI_LEAF_MAP);
            return;
        }
        PhysicalOperator mapLeaf = mapLeaves.get(0);
        if (!(mapLeaf instanceof POLocalRearrange)) {
            return;
        }
        POLocalRearrange rearrange = (POLocalRearrange)mapLeaf;

        List<PhysicalOperator> reduceRoots = reducePlan.getRoots();
        if (reduceRoots.size() != 1) {
            messageCollector.collect("Expected reduce to have single root", MessageType.Warning,
                    PigWarning.MULTI_ROOT_REDUCE);
            return;
        }
}

List<PhysicalOperator> mapLeaves = mapPlan.getLeaves();
? ? ? ? if (mapLeaves == null || mapLeaves.size() != 1) {
? ? ? ? ? ? messageCollector.collect("Expected map to have single leaf", MessageType.Warning,
? ? ? ? ? ? ? ? ? ? PigWarning.MULTI_LEAF_MAP);
? ? ? ? ? ? return;
? ? ? ? }

检查传入的MapReduce作业mapPlan是否包含聚集和遍历过程。

POLocalRearrange rearrange = (POLocalRearrange)mapLeaf

获取Map中的POLocalRearrange类型数据

总结

本周分析了执行引擎中的几个工具类中的方法,了解了一些执行引擎中的一些操作过程。

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-10-11 17:35:16  更:2021-10-11 17:36:46 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/18 8:14:12-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码