IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> HDFS的基本操作 -> 正文阅读

[大数据]HDFS的基本操作

前提要求:已成功搭建Hadoop集群
【实验描述】
Hadoop提供也hadoop分布式文件系统交互的命令,通过了解Hadoop shell命令的用法。掌握对hadoop分布式系统的操作;以下是一些基础命令操作。

  1. 查看hdfs分布式系统根目录下所有文件和文件夹信息
[root@hadoop1 ~]# hdfs dfs -ls /
  1. 利用hdfs dfs –mkdir 命令在hdfs上创建test1、test2和test3目录。
[root@hadoop1 ~]# hdfs dfs -mkdir /test1
[root@hadoop1 ~]# hdfs dfs -mkdir /test2
[root@hadoop1 ~]# hdfs dfs -mkdir /test3
[root@hadoop1 ~]# hdfs dfs -ls /
Found 3 items
drwxr-xr-x   - root supergroup          0 2021-11-12 10:18 /test1
drwxr-xr-x   - root supergroup          0 2021-11-12 10:18 /test2
drwxr-xr-x   - root supergroup          0 2021-11-12 10:20 /test3
  1. 在本地系统编辑文件test1.txt,操作命令如下:
[root@hadoop1 ~]# vim test1.txt
添加以下内容:
filename test1.txt

#同样操作创建test2.txt和test3.txt文件。
#利用hdfs dfs –put命令上传文件test1.txt到hdfs的/test1目录;上传文件test2.txt到hdfs的/test2.txt目录;上传文件test3.txt到hdfs的/test3.txt目录,操作命令如下:
[root@hadoop1 ~]# hdfs dfs -put test1.txt /test1
[root@hadoop1 ~]# hdfs dfs -put test2.txt /test2
[root@hadoop1 ~]# hdfs dfs -put test3.txt /test3

#上传成功后,利用hdfs dfs –ls命令进行查看
[root@hadoop1 ~]# hdfs dfs -ls /test1
Found 1 items
-rw-r--r--   3 root supergroup         19 2021-11-12 10:40 /test1/test1.txt
[root@hadoop1 ~]# hdfs dfs -ls /test2
Found 1 items
-rw-r--r--   3 root supergroup         19 2021-11-12 10:40 /test2/test2.txt
[root@hadoop1 ~]# hdfs dfs -ls /test3
Found 1 items
-rw-r--r--   3 root supergroup         19 2021-11-12 10:41 /test3/test3.txt
  1. 利用hdfs dfs –text命令查看文件的内容
[root@hadoop1 ~]# hdfs dfs -text /test1/test1.txt
filename test1.txt
#或命令hdfs dfs –cat查看文件内容
[root@hadoop1 ~]# hdfs dfs -cat /test1/test1.txt
filename test1.txt
  1. 利用hdfs dfs –appendToFile命令实现对hdfs分布式系统上文件内容的追加
在本地编辑testtmp.txt文件,文件内容为“filename testtmp.txt”,将testtmp.txt文件的内容追加到hdfs分布式系统的/test1/test1.txt文件后。
[root@hadoop1 ~]# hdfs dfs -appendToFile testtmp.txt /test1/test1.txt
#查看/test1/test1.txt文件内容
[root@hadoop1 ~]# hdfs dfs -text /test1/test1.txt			
filename test1.txt
filename testtmp.txt
  1. 利用hdfs dfs –cp命令将hdfs分布式系统下/test1/test1.txt文件复制到/test2/目录中
[root@hadoop1 ~]# hdfs dfs -ls /test2
Found 2 items
-rw-r--r--   3 root supergroup         40 2021-11-12 10:57 /test2/test1.txt
-rw-r--r--   3 root supergroup         19 2021-11-12 10:40 /test2/test2.txt
  1. 利用hdfs dfs –rm命令将hdfs分布式系统下/test2/test1.txt文件删除
[root@hadoop1 ~]# hdfs dfs -rm /test2/test1.txt
Deleted /test2/test1.txt
[root@hadoop1 ~]# hdfs dfs -ls /test2
Found 1 items			
-rw-r--r--   3 root supergroup         19 2021-11-12 10:40 /test2/test2.txt
  1. 利用hdfs dfs –mv 命令将hdfs分布式系统上/test2/test2.txt文件移动到/test1目录中
[root@hadoop1 ~]# hdfs dfs -ls /test1
Found 1 items
-rw-r--r--   3 root supergroup         40 2021-11-12 10:55 /test1/test1.txt
[root@hadoop1 ~]# hdfs dfs -mv /test2/test2.txt /test1
[root@hadoop1 ~]# hdfs dfs -ls /test1
Found 2 items
-rw-r--r--   3 root supergroup         40 2021-11-12 10:55 /test1/test1.txt
-rw-r--r--   3 root supergroup         19 2021-11-12 10:40 /test1/test2.txt
[root@hadoop1 ~]# hdfs dfs -ls /test2    // 该目录下的文件已经删除
  1. 利用hdfs dfs -moveFromLocal 命令将本地文件testtmp.txt文件从本地移动到hdfs 系统的/test2目录中(本地文件会被删除)
[root@hadoop1 ~]# hdfs dfs -ls /test2
[root@hadoop1 ~]# hdfs dfs -moveFromLocal testtmp.txt /test2
[root@hadoop1 ~]# hdfs dfs -ls /test2
Found 1 items
-rw-r--r--   3 root supergroup         21 2021-11-12 11:02 /test2/testtmp.txt
同时在本地利用ls命令进行查看,会发现testtmp.txt文件被删除。
  1. 在本地系统的根目录下建立test文件夹,利用hdfs dfs –get命令将hdfs分布式系统上/test1/test1.txt文件下载到本地根目录下的test文件夹,操作命令如下。
[root@hadoop1 ~]# mkdir /test
[root@hadoop1 ~]# cd /test
[root@hadoop1 test]# ls
[root@hadoop1 test]# hdfs dfs -get /test1/test1.txt
[root@hadoop1 test]# ls
test1.txt
[root@hadoop1 test]# hdfs dfs -ls /test1
Found 2 items
-rw-r--r--   3 root supergroup         40 2021-11-12 10:55 /test1/test1.txt
-rw-r--r--   3 root supergroup         19 2021-11-12 10:40 /test1/test2.txt
  1. 将hdfs分布式系统下/test2目录下的文件,最后删除/test2目录。
[root@hadoop1 test]# hdfs dfs -rm /test2/*.*
Deleted /test2/testtmp.txt
[root@hadoop1 test]# hdfs dfs -rmdir /test2
[root@hadoop1 test]# hdfs dfs -ls /
Found 2 items
drwxr-xr-x   - root supergroup          0 2021-11-12 11:00 /test1
drwxr-xr-x   - root supergroup          0 2021-11-12 10:41 /test3
  1. 快照的基本操作
    具体要求为:HDFS文件系统的根目录下存在一个/test1的文件目录,要求开启该目录的可创建快照功能,并为该目录文件创建快照,快照名称为import-data,使用相关命令查看该快照文件的列表信息。同时删除/test1目录下的文件,并利用快照进行恢复。
#开启目录的可创建快照功能
[root@hadoop1 /]# hadoop dfsadmin -allowSnapshot /test1 
DEPRECATED: Use of this script to execute hdfs command is deprecated.
Instead use the hdfs command for it.
Allowing snaphot on /test1 succeeded
[root@hadoop1 /]# hdfs dfs -createSnapshot /test1 import-data  
//建立快照
Created snapshot /test1/.snapshot/import-data
[root@hadoop1 /]# hadoop fs -ls /test1/.snapshot    //查看快照文件
Found 1 items
drwxr-xr-x   - root supergroup          0 2021-11-12 08:31 /test1/.snapshot/import-data
[root@hadoop1 /]# hdfs dfs -ls /test1
Found 2 items
-rw-r--r--   3 root supergroup         40 2021-11-12 10:55 /test1/test1.txt
-rw-r--r--   3 root supergroup         19 2021-11-12 10:40 /test1/test2.txt
[root@hadoop1 /]# hdfs dfs -rm -r /test1/*.txt   //删除文件
Deleted /test1/test1.txt
Deleted /test1/test2.txt
[root@hadoop1 /]# hdfs dfs -ls /test1      // 可以看到文件已经删除
[root@hadoop1 /]# hdfs dfs -cp -ptopax /test1/.snapshot/import-data/*.txt /test1					//恢复快照到/test1目录
[root@hadoop1 /]# hdfs dfs -ls /test1
Found 2 items
-rw-r--r--   3 root supergroup         40 2021-11-12 10:55 /test1/test1.txt
-rw-r--r--   3 root supergroup         19 2021-11-12 10:40 /test1/test2.txt
  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-11-25 08:11:03  更:2021-11-25 08:11:08 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 8:33:43-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码