IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> spark疑难杂症 -> 正文阅读

[大数据]spark疑难杂症

背景:上周spark任务还能正常运行。突然执行就开始报错?

写了一个spark的功能读取csv然后导入到hive功能,

先看报错FileNotFoundException :这个报错可太简单了吧,不是就是文件文件找不到,啥文件找不到我就复制啥文件不好了么?是哪个文件?怎么好像打印乱码了呢? 先不管。。。。

在接着看

TGT Renewer for hive@CDH.COM] security.UserGroupInformation (UserGroupInformation.java:run(1026)) - Exception encountered while running the renewal command for hive@CDH.COM. (TGT end time:1629455062000, renewalFailures: 0, renewalFailuresTotal: 1

什么kerberos报错了?擦怎么回事,是认证过期?还是登录失败,还是kerberos server还是client有问题?一瞬间大脑开始有了无数个想法

java.io.FileNotFoundException: File file:/data/share/dw_ia_portraitsearch/shell/2021-08-20 15:29:28,848 WARN  [TGT Renewer for hive@CDH.COM] security.UserGroupInformation (UserGroupInformation.java:run(1026)) - Exception encountered while running the renewal command for hive@CDH.COM. (TGT end time:1629455062000, renewalFailures: 0, renewalFailuresTotal: 1) does not exist
	at org.apache.hadoop.fs.RawLocalFileSystem.deprecatedGetFileStatus(RawLocalFileSystem.java:641)
	at org.apache.hadoop.fs.RawLocalFileSystem.getFileLinkStatusInternal(RawLocalFileSystem.java:867)
	at org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:631)
	at org.apache.hadoop.fs.FilterFileSystem.getFileStatus(FilterFileSystem.java:442)
	at org.apache.spark.scheduler.EventLoggingListener.start(EventLoggingListener.scala:103)
	at org.apache.spark.SparkContext.<init>(SparkContext.scala:533)
	at org.apache.spark.SparkContext$.getOrCreate(SparkContext.scala:2549)
	at org.apache.spark.sql.SparkSession$Builder$$anonfun$7.apply(SparkSession.scala:944)
	at org.apache.spark.sql.SparkSession$Builder$$anonfun$7.apply(SparkSession.scala:935)
	at scala.Option.getOrElse(Option.scala:121)
	at org.apache.spark.sql.SparkSession$Builder.getOrCreate(SparkSession.scala:935)
	at com.tencent.s2.job.Kudu2HiveJob.launch(Kudu2HiveJob.java:51)
	at com.tencent.s2.AppJob$1.run(AppJob.java:56)
	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
	at java.lang.Thread.run(Thread.java:748)

?

立马开始查看 klist 没有过期

[devuser@worker01 /data/share/dw_ia_portraitsearch/shell]$ klist
Ticket cache: FILE:/tmp/krb5cc_1000
Default principal: hive@CDH.COM

Valid starting ? ? ? Expires ? ? ? ? ? ? ?Service principal
2021-08-24T18:05:39 ?2021-08-25T18:05:39 ?krbtgt/CDH.COM@CDH.COM
?? ?renew until 2021-08-31T18:05:39

?代码里的认证

?

?查看打印日志 也没啥问题?

这就奇了怪了。

仔细看日志里有 [TGT Renewer for hive@CDH.COM]

是续期失败?赶快截图给运维看下,运维说没啥问题啊。

继续看日志

21/08/24 18:05:41 INFO security.UserGroupInformation: Login successful for user hive@CDH.COM using keytab file /data/share/hive.keytab. Keytab auto renewal enabled : false

显示登录成功了啊,按道理应该没问题了 ,怎么回事啊

备注:此时我到了这陷入了kerberos的奇怪问题中,但是FileNotFInd这个问题直接pass了?。。。

继续看..

Warning: Ignoring non-spark config property: hdfs=//s2cluster/user/spark/applicationHistory
Warning: Ignoring non-spark config property: ExitCodeException=exitCode=1: kinit: KDC can't fulfill requested option while renewing credentials
Warning: Ignoring non-spark config property: at=java.lang.Thread.run(Thread.java:748)
启动的时候出现了warning?

而且说没有spark的属性,这些属性都有点奇怪,一般不是spark.xx.xx这样的么,仔细看又出现了

?kinit: KDC can't fulfill requested option while renewing credentials?

又是kerberos。。。。

自此陷入了kerberos的怪圈,肯定是有问题,思考了一上午,顺带把kerberos的命令又都测了一遍,无果。

百度?https://www.oschina.net/question/4191871_2316093

?其实中间我还看了spark的源码。

第一方面?java.io.FileNotFoundException

?确实报的文件不存在。

第二方面我还看了报错RawLocalFileSystem

?? ?at org.apache.hadoop.fs.RawLocalFileSystem.getFileLinkStatusInternal(RawLocalFileSystem.java:867

为什么是本地文件系统,不应该是hdfs的文件系统么

研究无果。。。其实我一直离真相只差一步。

答案就是问题FileNotFind 这个问题上,这个文件不存在,那就是文件不存在。

java.io.FileNotFoundException: File file:/data/share/dw_ia_portraitsearch/shell/2021-08-20 15:29:28,848 WARN ?[TGT Renewer for hive@CDH.COM] security.UserGroupInformation (UserGroupInformation.java:run(1026)) - Exception encountered while running the renewal command for hive@CDH.COM. (TGT end time:1629455062000, renewalFailures: 0, renewalFailuresTotal: 1) does not exist
这么一长串就是文件名字!!!!!!!!那么肯定是有人传参有问题,或者配置项有问题

而且 spark都说了Warning: Ignoring non-spark config property:? 那就是说加载了spark不能读取的kv对。

所以我怀疑是有人动了cdh配置,反复询问,都说没人动。而且此时运维说flink也能正常跑啊,那就是spark不能跑。

突然灵光一闪,先前百度有人说是配置文件,那么就是这里有问题,看下。spark配置文件是啥呢???

查看文件简直不敢相信 我的眼睛。。。这些东西从哪里来的????

?删除即可。唉。。。

总结下这个事情解决思路。

习惯把简单问题复杂化,既然报了这个错,那就是这个错,至于输出乱码不存在的,别人的代码习惯比我们强

报了错 一定要理清思路。。。

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-25 12:16:45  更:2021-08-25 12:17:41 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 13:24:58-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码