IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 从零开始搭建CDH(三)---观察HDFS -> 正文阅读

[大数据]从零开始搭建CDH(三)---观察HDFS

? ? ? ? 之前在CDH上安装好了服务HDFS,这里观察一下HDFS包括数据持久化和文件读写在内的一些工作流程。

目录

1. 数据持久化观察

?2. HDFS文件读写观察

2.1 新建文件目录?

2.2 上传文件

2.3 下载文件?

?


1. 数据持久化观察

? ? ? ? 进入HaDoop页面观察其启动过程:

  1. ? ? ? ? ? ? 加载镜像文件fsimage
  2. ? ? ? ? ? ? 加载日志文件edits
  3. ? ? ? ? ? ? 保留checkpoint
  4. ? ? ? ? ? ? 退出安全模式?

? ? ? ? 进入node0:/dfs/nn/current,观察editlog的id在fsimage的id之后,即editlog记录的是保存镜像之后的操作信息(截图之后了,这是启动后经历过依次checkpoint了)。?

? ? ? ? 进入node1:/dfs/nn/current,观察可得,SNN从NN拷贝最后时点的Fsimage和增量的Editlog,合并成最新时点的Fsimage,并将其发送给NN(截图之后了,这是启动后经历过依次checkpoint了)。

?2. HDFS文件读写观察

? ? ? ? 从CDH的”文件浏览器”或从Hadoop页面”Utilities”-->”Browse the file system”可查看HDFS文件。此时只有一个CDH启动HDFS时写入的测试文件。

2.1 新建文件目录?

? ? ? ? 尝试在HDFS根目录下创建一个bigdata路径

? ? ? ? 补充知识点 (hadoop fs、hadoop dfs与hdfs dfs命令的区别及hadoop fs命令说明

hadoop fs -mkdir /bigdata

? ? ? ? 报如下权限错误

mkdir: Permission denied: user=root, access=WRITE, inode="/":hdfs:supergroup:drwxr-xr-x

? ? ? ? 参考下面两篇文章可解决权限问题,要么关闭HDFS的权限检查,要么每次切换成hdfs用户执行命令,要么用hdfs建立路径后更改权限为root。

【HDFS】mkdir: Permission denied: user=root, access=WRITE, inode="/":hdfs:supergroup:drwxr-xr-x

?HDFS上传文件错误:Permission denied: user=root, access=WRITE, inode="/user"

? ? ? ? 我这里直接在CDH上关闭HDFS权限检查了,保存更改后重启HDFS服务。?

? ? ? ? ?重启服务后执行命令,创建文件目录。

hadoop fs -mkdir /bigdata
hadoop fs -mkdir -p /user/root

2.2 上传文件

? ? ? ? 在node0里挑两个文件,一个大小为2.22M,一个大小为176.42M,上传到/user/root目录,默认的块大小为128M,可以借此观察下文件分块情况。

? ? ? ? 执行命令,可以看到文件被上传到了HDFS对应路径下。

? ? ? ? ps:这里把副本数量从3修改为2,因为只有两个datanode节点。

hadoop fs -put /opt/oracle-j2sdk1.8-1.8.0+update181-1.x86_64.rpm /user/root
hadoop fs -put /opt/mysql-connector-java.jar /user/root

? ? ? ? 进入Hadoop文件系统页面,可点击文件名查看分块情况。?

? ? ? ? ?首先查看大小为2.22M的mysql文件,可以看到只有一个块block0,且这个块在node1和node2都可以获取,即两个副本分别存储在node1和node2上。

? ? ? ? ?再看另一个176. 42M的文件,可见文件被切分成了大小为134217728B(128MB)的Block0和大小为50770613B(48.42MB)的Block1。

?

? ? ? ? 进入node1的对应路径下查看所保存的block,进入datanode,找到保存刚上传的Oracle文件的目录,可见如下对应的block文件块以及其.meta的校验文件。

我的路径:

?node1:/dfs/dn/current/BP-1562683945-192.168.137.100-1628072094899/current/finalized/subdir0/subdir2

?

2.3 下载文件?

hadoop fs  -get /user/root/mysql-connector-java.jar   /home
hadoop fs  -get /user/root/oracle-j2sdk1.8-1.8.0+update181-1.x86_64.rpm   /home

? ? ? ? 将HDFS上的文件下载至本地/home目录下。

? ? ? ? ?

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-12 16:40:01  更:2021-08-12 16:41:44 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 9:35:04-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码