IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> hadoop学习 -> 正文阅读

[大数据]hadoop学习

hadoop基本组成

MapReduce计算框架

Map:将split分片数据按照key,value格式进行组织后数据存入本地磁盘,后续做为Reduce阶段的输入
Reduce:Map阶段结果shuffle之后,做merge,输入Reduce节点进行计算处理,最终结果存入HDFS文件系统
Combine: 非必须,满足幂等性质,及函数复合多次的结果等于1次作用的结果;主要作用是在Map和reduce之间,对map结果进行一步合并,减少网络传输数据量

HDFS分布式文件系统

  1. 文件读流程:Client请求NameNode,获取DataNode列表,按照返回列表,请求对应的datanode节点获取数据;如果datanode网络连接异常或者datanode节点异常,则发送异常信息给namenode,获取数据备份节点的位置,重新连接datanode请求数据;
    读取完成
  2. 文件写流程:client发送写请求给namenode,返回对应的datanode列表;数据分片后加入数据队列,依次写入每个datanode中,同时维护ack数据当每个datanode写入成功后将ack信号传递给下一个datanode; 最后一个datanode写入成功后,将ack信号传回client; client将成功消息传给namenode。如果某个datanode写失败,则当前datanode与namenode通讯,重新分配datanode,按之前方式继续进行。

YARN资源管理系统

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-07-07 11:46:23  更:2021-07-07 11:47:46 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/4 18:06:01-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码