| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> MapReduce并行计算构架流程 -> 正文阅读 |
|
[大数据]MapReduce并行计算构架流程 |
? ? MapReduce 概述
MapReduce 原理
MapReduce 角色
? WordCount 执行流程 ? ? ? ? Map 阶段:
WordCount 执行流程
MapReduce 运行流程
Sort:按照 key 进行排序和聚合; MapReduce 运行流程
MapReduce 运行流程
排序:分区后放在一起的数据按照 key 进行升序排列 MapReduce 运行流程 Map 中的 Spill 阶段: Spill(溢写):
Merge(合并):
MapReduce 运行流程
即使设置了,是否执行也由集群根据当时状况决定是否执行 ? ? ? MapReduce 运行流程 Reduce 阶段:
MR运行流程 1. 对数据进行切片,决定启动多少个 map 程序; 2. 切片中的数据转换为 key-value 格式输入 map 程序; 3. map 程序处理输入的数据,并输出分析结果; 4. map 的分析结果会先写入内存缓存区,在内存缓冲区中进行分区和排序; 5. 每当缓冲区数据达量达到阈值(80%)的时候,就进行一次性溢写操作,把数据写入磁盘; 6. 合并多次溢写产生的小文件,并保持数据分区且有序; 7. reduce 从各个 map 下载需要自己汇总的数据; 8.reduce 合并下载的所有文件,并进行排序和聚合操作,形成新的 key-value 数据; 9. 聚合后的 key-value 依次输入 reduce 程序进行汇总; 10. 把汇总结果保存到指定位置; Shuffle
MapReduce 调优
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/23 10:08:01- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |