[大数据] 记一次hive查询报错的问题

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> 记一次hive查询报错的问题 -> 正文阅读

[大数据]记一次hive查询报错的问题

记一次hive查询报错的问题

CDH中安装完hive后，执行select count(*) from table,居然报错了
在这里插入图片描述
进入yarn的webui页面，查看对应的任务的logs

重点是这句：

Error running local (uberized) 'child' : java.lang.UnsatisfiedLinkError: org.apache.hadoop.util.NativeCodeLoader.buildSupportsSnappy()Z

网上找了一圈，说是Mapreduce任务进入Uber模式，但是ApplicationMaster没有加载Native Libraries，并且提供了一种方法可以试试：

1.在CM上设置参数：yarn.app.mapreduce.am.command-opts为" -Djava.net.preferIPv4Stack=true - Djava.library.path=/opt/cloudera/parcels/CDH-5.5.4-1.cdh5.5.4.p0.9/lib/hadoop/lib/native"
2.在Hive客户端里制定参数：set yarn.app.mapreduce.am.command-opts=-Djava.library.path=/opt/cloudera/parcels/CDH-5.5.4-1.cdh5.5.4.p0.9/lib/hadoop/lib/native
存在问题：如果在Hive中set参数，貌似参数值不能出现空格，也就是说不能使用多个-D的方式。

经过测试，还是没有解决问题，最后在yarn的配置里面把mapreduce.job.ubertask.enable的选项取消勾选，再次运行就可以成功。
在这里插入图片描述
顺便查了一下，Uber模式是Hadoop2.0中实现的一种针对MR小作业的优化机制。mapreduce.job.ubertask.enable用来控制是否开启Uber运行模式，默认为false。而启用Uber运行模式会对小作业进行优化，不会给每个任务分别申请分配Container资源，这些小任务将统一在一个Container中按照先执行map任务后执行reduce任务的顺序串行执行。
Hadoop中对Uber模式的定义：