IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 数据湖之Hudi(2):Hudi编译 -> 正文阅读

[大数据]数据湖之Hudi(2):Hudi编译

目录

0. 相关文章链接

1. Hudi源码包下载

2. 基于CentOS7编译Hudi(默认Spark等组件版本)

3. 基于windows编译Hudi(默认Spark等组件版本)

4. 基于windows编译Hudi(选择Spark等组件版本)

5. 基于CentOS7编译Hudi(选择Spark等组件版本)

6. 基于windows编译Hudi报错解决方案

7. 各Hudi编译后Jar包下载地址


0. 相关文章链接

大数据基础知识点 文章汇总

1. Hudi源码包下载

????????因为Hudi不像Hive、Hadoop等组件一样,解压安装即可使用;而是需要先下载源码,然后根据需要的Hudi版本以及各集成的组件(包括Spark等)版本进行编译;所以需要先下载Hudi的源码包,可以在github中下载,下载地址:GitHub - apache/hudi: Upserts, Deletes And Incremental Processing on Big Data.

2. 基于CentOS7编译Hudi(默认Spark等组件版本)

需要在centos7中安装mavne,maven下载安装教程:Maven的下载安装和使用_yang_shibiao的博客-CSDN博客

可以修改CentOS7为国内镜像,修改教程:CentOS7 原生 yum 源修改为阿里 yum 源_yang_shibiao的博客-CSDN博客

上传对应的zip包,然后解压,解压后如下所示:

注:博主下载的是0.10.1版本,已对根目录进行重命名,并且因为博主已经进行编译,所以其中有packaging包

执行命令,进行编译,编译命令:?mvn package -DskipTests

因为编译时会下载相关maven依赖包,所以可以根据上述maven下载安装博文中所示,配置国内镜像,提高下载速度,具体编译时间根据机器和网络来判断,一共会下载1.5G左右的jar包,博主经过多次编译,在maven仓库中无任何Jar包时一共编译了6小时,当所有Jar都有再次编译时,7分钟可以编译完成,编译完成后如下图所示:

3. 基于windows编译Hudi(默认Spark等组件版本)

需要在windows中安装maven,并配置好相应的环境变量,可以参考maven下载安装教程:Maven的下载安装和使用_yang_shibiao的博客-CSDN博客

从github上下载对应的hudi包,然后解压该包,会生成如下图所示内容:

在上述目录下执行maven的编译命令:?mvn package -DskipTests

前面30多个包能正常编译,会发现 hudi-integ-test包编译失败,如下图所示:

这是因为这是在windows环境中执行的,hudi-integ-test模块会执行linux环境下的 bash? 脚本,从而执行失败,需要把这个模块注释掉,再次执行发现packaging/hudi-integ-test-bundle模块会引用hudi-integ-test这个模块的内容,于是两个test模块都注释掉,如下图所示:

再次执行编译脚本,运行成功,如下图所示:?mvn package -DskipTests

4. 基于windows编译Hudi(选择Spark等组件版本)

直接执行如下编译命令即可,可以选择对应的Spark版本和Scala版本等:?mvn clean package -DskipTests -Dspark3 -Dscala-2.12 ?

5. 基于CentOS7编译Hudi(选择Spark等组件版本)

直接执行如下编译命令即可,可以选择对应的Spark版本和Scala版本等:?mvn clean package -DskipTests -Dspark3 -Dscala-2.12 ?

6. 基于windows编译Hudi报错解决方案

如上第3节?基于windows编译Hudi(默认Spark等组件版本) 所示,是因为hudi-integ-test模块会执行linux环境中的bash脚本,需要把hudi-integ-test模块注释,再次执行发现packaging/hudi-integ-test-bundle模块会引用hudi-integ-test这个模块的内容,于是两个test模块都注释掉,这样就可以在windows中进行编译。

7. 各Hudi编译后Jar包下载地址

待更新...


注:Hudi系列博文为通过对Hudi官网学习记录所写,其中有加入个人理解,如有不足,请各位读者谅解???

注:其他相关文章链接由此进(包括Hudi在内的各大数据相关博文) ->?大数据基础知识点 文章汇总


  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-02-14 21:14:25  更:2022-02-14 21:17:12 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 11:49:51-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码