IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> presto本地开发,访问Hive报错:Unable to create input format org.apache.hadoop.mapred.TextInputFormat -> 正文阅读

[大数据]presto本地开发,访问Hive报错:Unable to create input format org.apache.hadoop.mapred.TextInputFormat

1. 序言

  • 出于工作需要,使用mac + IntelliJ IDEA,搭建了一个可以访问Hive的本地开发环境

  • 执行查询时报错:

    Query 20220422_084012_00000_34axr failed: Unable to create input format org.apache.hadoop.mapred.TextInputFormat
    
  • 查看日志,具体的报错信息如下:

    com.facebook.presto.spi.PrestoException: Unable to create input format org.apache.hadoop.mapred.TextInputFormat
    	at com.facebook.presto.hive.HiveUtil.getInputFormat(HiveUtil.java:328)
    	at com.facebook.presto.hive.BackgroundHiveSplitLoader.loadPartition(BackgroundHiveSplitLoader.java:299)
    	at com.facebook.presto.hive.BackgroundHiveSplitLoader.loadSplits(BackgroundHiveSplitLoader.java:272)
    	// 省略部分内容
    Caused by: java.lang.RuntimeException: Error in configuring object
    	at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:112)
    	at org.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:78)
    	at org.apache.hadoop.util.ReflectionUtils.newInstance(ReflectionUtils.java:136)
    	at com.facebook.presto.hive.HiveUtil.getInputFormat(HiveUtil.java:325)
    	... 11 more
    Caused by: java.lang.reflect.InvocationTargetException
    	at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    	at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    	at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    	at java.lang.reflect.Method.invoke(Method.java:498)
    	at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:109)
    	... 14 more
    Caused by: java.lang.IllegalArgumentException: Compression codec com.hadoop.compression.lzo.LzoCodec not found.
    	at org.apache.hadoop.io.compress.CompressionCodecFactory.getCodecClasses(CompressionCodecFactory.java:139)
    	at org.apache.hadoop.io.compress.CompressionCodecFactory.<init>(CompressionCodecFactory.java:180)
    	at org.apache.hadoop.mapred.TextInputFormat.configure(TextInputFormat.java:45)
    	... 19 more
    Caused by: java.lang.ClassNotFoundException: Class com.hadoop.compression.lzo.LzoCodec not found
    	at org.apache.hadoop.conf.Configuration.getClassByName(Configuration.java:2101)
    	at org.apache.hadoop.io.compress.CompressionCodecFactory.getCodecClasses(CompressionCodecFactory.java:132)
    	... 21 more
    
  • 从报错信息看,应该是java.lang.ClassNotFoundException: Class com.hadoop.compression.lzo.LzoCodec not found导致Unable to create input format org.apache.hadoop.mapred.TextInputFormat

2. 解决办法

2.1 确认缺失的maven依赖

  • 按照之前使用Flink jar任务实现ETL时的经验来看,ClassNotFoundException一般都是因为程序在运行时无法找到对应的类
  • 这时候,可以通过IDEA的快捷键查找com.hadoop.compression.lzo.LzoCodec这个类
    在这里插入图片描述
  • 通过查看这两个类,发现在分别位于lzo-hadoop-1.0.5.jarhadoop-lzo-0.4.15-cdh5.14.4.jar
  • 在presto项目目录下,通过find命令搜索jar包,发现hadoop-lzo-0.4.15-cdh5.14.4.jar在本地磁盘中存在
  • 大胆推测,缺少的应该是hadoop-lzo-0.4.15-cdh5.14.4.jar对应的maven依赖

2.2 解决办法

  • 根据jar包名与maven依赖写法之间的关系,同时结合网上搜索的结果,确定了maven依赖的写法如下:

    <dependency>
        <groupId>com.hadoop.gplcompression</groupId>
        <artifactId>hadoop-lzo</artifactId>
        <version>0.4.15-cdh5.14.4</version>
        <scope>runtime</scope>
    </dependency>
    
  • 将该依赖添加到presto-hive-hadoop2模块的pom.xml文件中

2.3 为什么使用runtime作为依赖范围?

  • 最开始时,并未指定scope,默认使用compile类型的scope

  • 编译时报错:

    [INFO] --- maven-dependency-plugin:3.1.1:analyze-only (default) @ presto-hive-hadoop2 ---
    [WARNING] Unused declared dependencies found:
    [WARNING]    com.hadoop.gplcompression:hadoop-lzo:jar:0.4.15-cdh5.14.4:compile
    
  • 说明,在编译时并不需要该依赖,于是改成了runtime类型的scope

2.4 重新编译模块,解决问题

  • 进入presto-hive-hadoop2模块的根目录,执行maven命令重新编译该模块

    mvn clean install -DskipTests
    
  • 编译完成后,重新运行Presto服务,查询OK

3. 题外话

3.1 如何确定模块?

  • 不要问我怎么知道应该修改这个模块的pom文件,我只想说这是来自同事的提点和自多次尝试后的结果

  • 后面回过头来看,编译后的Presto安装包的plugin目录中存在hadoop-lzo-0.4.15-cdh5.14.4.jar
    在这里插入图片描述

  • 同时,结合编译时的fileSet配置配置,说明hive-hadoop2目录对应的应该就是presto-hive-hadoop2模块

    <fileSet>
        <directory>${project.build.directory}/dependency/presto-hive-hadoop2-${project.version}</directory>
        <outputDirectory>plugin/hive-hadoop2</outputDirectory>
    </fileSet>
    

3.2 Could not load native gpl library错误

  • 虽然查询成功了,但执行日志中却存在Could not load native gpl library的错误

    2022-04-22T17:33:30.362+0800	ERROR	hive-hive-0	com.hadoop.compression.lzo.GPLNativeCodeLoader	Could not load native gpl library
    java.lang.UnsatisfiedLinkError: no gplcompression in java.library.path
    	at java.lang.ClassLoader.loadLibrary(ClassLoader.java:1867)
    	at java.lang.Runtime.loadLibrary0(Runtime.java:870)
    	at java.lang.System.loadLibrary(System.java:1122)
    	at com.hadoop.compression.lzo.GPLNativeCodeLoader.<clinit>(GPLNativeCodeLoader.java:32)
    	at com.hadoop.compression.lzo.LzoCodec.<clinit>(LzoCodec.java:71)
    	at java.lang.Class.forName0(Native Method)
    	at java.lang.Class.forName(Class.java:348)
    	at org.apache.hadoop.conf.Configuration.getClassByNameOrNull(Configuration.java:2134)
    	at org.apache.hadoop.conf.Configuration.getClassByName(Configuration.java:2099)
    	at org.apache.hadoop.io.compress.CompressionCodecFactory.getCodecClasses(CompressionCodecFactory.java:132)
    	at org.apache.hadoop.io.compress.CompressionCodecFactory.<init>(CompressionCodecFactory.java:180)
    	at org.apache.hadoop.mapred.TextInputFormat.configure(TextInputFormat.java:45)
    	at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    	at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    	at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    	at java.lang.reflect.Method.invoke(Method.java:498)
    	at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:109)
    	at org.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:78)
    	at org.apache.hadoop.util.ReflectionUtils.newInstance(ReflectionUtils.java:136)
    	at com.facebook.presto.hive.HiveUtil.getInputFormat(HiveUtil.java:325)
    	at com.facebook.presto.hive.BackgroundHiveSplitLoader.loadPartition(BackgroundHiveSplitLoader.java:299)
    	at com.facebook.presto.hive.BackgroundHiveSplitLoader.loadSplits(BackgroundHiveSplitLoader.java:272)
    	at com.facebook.presto.hive.BackgroundHiveSplitLoader.access$300(BackgroundHiveSplitLoader.java:102)
    	at com.facebook.presto.hive.BackgroundHiveSplitLoader$HiveSplitLoaderTask.process(BackgroundHiveSplitLoader.java:201)
    	at com.facebook.presto.hive.util.ResumableTasks.safeProcessTask(ResumableTasks.java:47)
    	at com.facebook.presto.hive.util.ResumableTasks.access$000(ResumableTasks.java:20)
    	at com.facebook.presto.hive.util.ResumableTasks$1.run(ResumableTasks.java:35)
    	at com.facebook.airlift.concurrent.BoundedExecutor.drainQueue(BoundedExecutor.java:78)
    	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
    	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
    	at java.lang.Thread.run(Thread.java:748)
    
    
    2022-04-22T17:33:30.363+0800	ERROR	hive-hive-0	com.hadoop.compression.lzo.LzoCodec	Cannot load native-lzo without native-hadoop
    
  • 参考了线上环境的配置,发现应该是缺少与compression有关的lib

  • 自己尝试过,在jvm.config或者JVM启动参数中,给出相关的lib,但是依旧没有解决问题

    -Djava.library.path=/path_to/hadoop-gpl-compression
    
  • 还参考博客:Hadoop和Spark报com.hadoop.compression.lzo.LzoCodec not found错误集锦,添加了libhadoop、libsnappy有关的lib,也没有成功

  • 其他参考博客,也讲得差不多都是这些lib

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-04-24 09:31:36  更:2022-04-24 09:34:04 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 3:57:34-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码