IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 大数据第四次课笔记 -> 正文阅读

[大数据]大数据第四次课笔记

第四次课
hdfs采用Master和Slave主从架构来存储数据,由4部分组成:
HDFS ?Client:客户端 文件按块切分,与Namenode交互获取文件的位置,与DataNode交互,读取或写入数据,提供访问hdfs的命令
NameNode:管理者 ?管理hdfs的名称空间,数据块的位置信息,配置副本请求,处理客户端的读写请求
DataNode:具体操作者 存储文件 执行数据块的读写操作
Secondary NameNode:辅助元数据 对NameNode的辅助 对镜像进行定期合并
HDFS的功能:
1.命名空间管理,命名空间包括目录,文件和块的信息
2.块的存储和物理存储

HDFS的工作机制:
? ? NameNode负责管理整个文件的命名信息和块信息
? ? DataNode负责管理用户的文件数据块
DataNode会定期向NameNode汇报自身所保存的文件的块信息
客户端请求HDFS会向NameNode申请来进行访问
SecondaryNameNode会进行镜像备份和对日志与镜像进行定期合并

HDFS的写入数据的流程:
1.客户端向NameNode通信请求上传文件,NameNode检查文件是否存在,目录是否存在,向客户端返回是否可以上传
2.客户端请求第一个块应该传输到哪些DataNode服务器上,NameNode返回3个DataNode服务器的地址
3.客户端向三台DataNode 服务器中的一台来上传数据,上传完成后第一台DataNode会向第二台DataNode上传数据
上传数据以packet为单位(64KB),第一台DataNode也会向第三台DataNode上传数据

HDFS的读取数据的流程:
1.客户端和NameNode通信查询元数据的信息,找出块所在的DataNode服务器
2.挑选一台最近的DataNode请求建立socket通信
3.DataNode开始发送数据,以packet(64KB)为单位进行发送和校验
4.客户端以packet(64KB)为单位接收,先保存在本地缓存,然后写入到目标文件。

解压文件:

yarn jar /opt/wordcount0801.jar com.zr.WordCountDriver /word.txt /output0801 jar包 驱动类? 文件 新文件名 可以实现用hdfs解压eclipse中的javajar包

查看文件内容

?

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-03 11:16:33  更:2021-08-03 11:17:53 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 5:44:25-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码