- 背景
分区字段dt为date类型,使用动态分区将四年半的数据按照日分区写入对应的分区中,动态分区后多出五个异常分区 这五个异常分区时string类型,都是空分区,里面没有数据 - 由于非日期类型影响了BI查询,所以需要将这五个分区删掉
- 解决方法
1.使用 alter table smartdb.smart_company_daily_dws drop partition(dt=‘F7A5457433’); alter table smartdb.smart_company_daily_dws drop partition(dt=‘FF80808104’); alter table smartdb.smart_company_daily_dws drop partition(dt=‘FF80808127’); alter table smartdb.smart_company_daily_dws drop partition(dt=‘FF808081F5’); alter table smartdb.smart_company_daily_dws drop partition(dt=‘HIVE_DEFAULT_PARTITION’); 命令删除分区,报如下错误
2.删除这五个分区对应的hdfs文件夹,然后msck repaire table alter table smartdb.smart_company_daily_dws drop partition(dt=‘F7A5457433’); alter table smartdb.smart_company_daily_dws drop partition(dt=‘FF80808104’); alter table smartdb.smart_company_daily_dws drop partition(dt=‘FF80808127’); alter table smartdb.smart_company_daily_dws drop partition(dt=‘FF808081F5’); alter table smartdb.smart_company_daily_dws drop partition(dt=‘HIVE_DEFAULT_PARTITION’); msck repair table smartdb.smart_company_daily_dws; 没想到连分区文件夹都不在了,show partitons这五个分区居然还在
3.尝试改变此分区字段的数据类型,然后再drop partition 一开始先 alter table smartdb.smart_company_daily_dws change column dt dt string; 报错 后来发现更改分区字段的数据类型命令不同,然后使用 ALTER TABLE smartdb.smart_company_daily_dws PARTITION COLUMN (dt string); 成功将分区字段数据类型改为string 然后使用drop partition命令可以删除异常分区
使用 ALTER TABLE smartdb.smart_company_daily_dws PARTITION COLUMN (dt date); 将分区字段数据类型改为date类型的时候报了如下错误 然后注意到报错信息中有in serial mode几个字 想把hive改为非严格模式再执行类型转换,但是失败了 解决方案见 https://blog.csdn.net/weixin_42913992/article/details/124827902?csdn_share_tail=%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22124827902%22%2C%22source%22%3A%22weixin_42913992%22%7D&ctrtid=GYXnr
|