问题
在使用sqoop导入Oracle数据时,报错如下:
INFO mapreduce.Job: Task Id : attempt_1646802944907_15460_m_000000_1, Status : FAILED
Error: java.io.IOException: SQLException in nextKeyValue
at org.apache.sqoop.mapreduce.db.DBRecordReader.nextKeyValue(DBRecordReader.java:275)
at org.apache.hadoop.mapred.MapTask$NewTrackingRecordReader.nextKeyValue(MapTask.java:568)
at org.apache.hadoop.mapreduce.task.MapContextImpl.nextKeyValue(MapContextImpl.java:80)
at org.apache.hadoop.mapreduce.lib.map.WrappedMapper$Context.nextKeyValue(WrappedMapper.java:91)
at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:145)
at org.apache.sqoop.mapreduce.AutoProgressMapper.run(AutoProgressMapper.java:64)
at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:799)
at org.apache.hadoop.mapred.MapTask.run(MapTask.java:347)
at org.apache.hadoop.mapred.YarnChild$2.run(YarnChild.java:174)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:422)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1875)
at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:168)
Caused by: java.sql.SQLException: ORA-24920: column size too large for client
原因
之前使用sqoop导入其他数据库的时候是正常的,这次从新数据库导入数据出了问题,先查看了一下两个数据库有什么不同,发现一个Oracle的版本是11,新加入的Oracle数据库版本是19,这可能是导致出问题的原因。 上网查一下ORA-24920的错误,说是要升级oracle client,进一步猜测可能是Oracle驱动的问题。 在sqoop工具的lib文件下,找到的sqoop用的Oracle JDBC驱动,是ojdbc6.jar,与Oracle19版本不匹配。 可以在这个页面查看Oracle版本和对应的Oracle JDBC驱动版本: https://www.oracle.com/database/technologies/faq-jdbc.html#02_03 截图如下: 下载页面链接如下: https://www.oracle.com/database/technologies/appdev/jdbc-downloads.html
解决
根据版本对应,下载了ojdbc8.jar,上传后,将原版本删除,重新导入数据就可以了 这里原版本的驱动,需要删除或者移动一下,不然不成功,猜测如果存在两个版本,可能读取的还是老版本
|