IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> HDFS 的Java API操作 -> 正文阅读

[大数据]HDFS 的Java API操作

HDFS 的Java API操作

1、环境搭建

基于Linux的Hadoop(2.7.4)集群
windowsp平台的hadoop
JDK
hadoop和jdk的环境变量
IDEA

2、下载windowsp平台的hadoop,版本要与Linux下的一致

可以使用下载的Linux平台的Hadoop解压。然后在/bin目录下添加Windows相关依赖winutils.exe、winutils.pdb、hadoop.dll
然后在目录hadoopw\hadoop-2.7.4\etc\hadoop下更改Java路径

注意:要把C:\Program Files 目录该为PROGRA1,因为PROGRA1是 C:\Program Files 目录的dos文件名模式下的缩写 。长于8个字符的文件名和文件夹名,都被简化成前面6个有效字符,后面~1,有重名的就 ~2

set JAVA_HOME=C:\Program Files\Java\jdk-16.0.2
set JAVA_HOME=C:\PROGRA~1\Java\jdk-16.0.2

在这里插入图片描述

3、环境变量配置
此电脑右键属性–>高级系统设置–>环境变量
在这里插入图片描述
系统环境变量,添加(不能有空格)
在这里插入图片描述找到path,编辑
在这里插入图片描述测试一下如下成功:
在这里插入图片描述

4、打开IDEA创建一个Maven工程
在这里插入图片描述下一步,下一步,完成就行

5、在pom.xml配置文件中引入hadoop-common、hadoop-hdfs、haddop-client3中依赖,同时引入junit的单元测试包:

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>org.example</groupId>
    <artifactId>hdfs-api</artifactId>
    <version>1.0-SNAPSHOT</version>

    <properties>
        <maven.compiler.source>16</maven.compiler.source>
        <maven.compiler.target>16</maven.compiler.target>
    </properties>
    <dependencies>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>2.7.4</version>
        </dependency>

        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-hdfs</artifactId>
            <version>2.7.4</version>
        </dependency>

        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>2.7.4</version>
        </dependency>
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>RELEASE</version>
        </dependency>
    </dependencies>

</project>

添加相关依赖后,Hadoop相关包就会自动下载:
在这里插入图片描述
6、初始化客户端对象

public class HDFS_CRUD {
    FileSystem fs = null;
    @Before
    public void init() throws Exception{
        Configuration conf=new Configuration();


        conf.set( "fs.defaultFS", "hdfs://hadoop01:9000");
        System.setProperty("HADOOP_USER_NAME","root");

        fs = FileSystem.get(conf);

    }

7、上传文件,先准备一个要上传的文件
在这里插入图片描述

上传文件:

//	上传文件
    @Test
    public void upload() throws Exception{
        //要上传的文件路径
        Path src=new Path("D:/1.txt");
        //上传到HDFS的目标路径
        Path dst=new Path("/testFile");
        fs.copyFromLocalFile(src,dst);
        fs.close();
    }

执行
在这里插入图片描述

执行结果:在这里插入图片描述

上传文件成功:
在这里插入图片描述打开看一下,是前面我们编辑好的1.txt内容
在这里插入图片描述
8、下载文件到本地:

@Test
    public void testDownloadFileToLocal() throws IllegalArgumentException,IOException{
        fs.copyToLocalFile(new Path("/wordcount/input/word.txt"),new Path("E:/hadoopw"));
        fs.close();
    }

在这里插入图片描述9、目录操作:

@Test
    public void catalogOperration() throws Exception{
        //创建目录
        fs.mkdirs(new Path("a/b/c"));
        fs.mkdirs(new Path("a2/b2/c2"));
        //重命名文件或文件夹
        fs.rename(new Path("testFile"),new Path("521.txt"));
        //删除文件夹
        fs.delete(new Path("/a2"),true);

    }

在这里插入图片描述
10、查看目录中的文件信息:

// 打印指定路径下的文件信息
    @Test
    public void listFile() throws FileNotFoundException, IllegalArgumentException, IOException{
//		true表示是否递归  返回的是迭代器对象
        RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path("/"), true);

        while(listFiles.hasNext()){
            LocatedFileStatus file = listFiles.next();
            System.out.println("owner:"+file.getOwner());
            System.out.println("filename:"+file.getPath().getName());
            System.out.println("blocksize:"+file.getBlockSize());
            System.out.println("replication:"+file.getReplication());
            System.out.println("permission:"+file.getPermission());
            BlockLocation[] blockLocations = file.getBlockLocations();
            for (BlockLocation b : blockLocations) {
                System.out.println("块的起始偏移量:"+b.getOffset());
                System.out.println("块的长度:"+b.getLength());
                String[] hosts = b.getHosts();
                for (String host : hosts) {
                    System.out.println("块所在的服务器:"+host);
                }
            }

            System.out.println("=========================================");
        }
    }

程序运行结果:
在这里插入图片描述

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-04-26 11:47:11  更:2022-04-26 11:51:06 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 3:08:49-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码