IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> hive动态分区后多出5个异常分区文件 -> 正文阅读

[大数据]hive动态分区后多出5个异常分区文件

  • 背景
    分区字段dt为date类型,使用动态分区将四年半的数据按照日分区写入对应的分区中,动态分区后多出五个异常分区
    在这里插入图片描述
    这五个异常分区时string类型,都是空分区,里面没有数据
  • 由于非日期类型影响了BI查询,所以需要将这五个分区删掉
  • 解决方法

1.使用
alter table smartdb.smart_company_daily_dws drop partition(dt=‘F7A5457433’);
alter table smartdb.smart_company_daily_dws drop partition(dt=‘FF80808104’);
alter table smartdb.smart_company_daily_dws drop partition(dt=‘FF80808127’);
alter table smartdb.smart_company_daily_dws drop partition(dt=‘FF808081F5’);
alter table smartdb.smart_company_daily_dws drop partition(dt=‘HIVE_DEFAULT_PARTITION’);
命令删除分区,报如下错误
在这里插入图片描述

2.删除这五个分区对应的hdfs文件夹,然后msck repaire table
alter table smartdb.smart_company_daily_dws drop partition(dt=‘F7A5457433’);
alter table smartdb.smart_company_daily_dws drop partition(dt=‘FF80808104’);
alter table smartdb.smart_company_daily_dws drop partition(dt=‘FF80808127’);
alter table smartdb.smart_company_daily_dws drop partition(dt=‘FF808081F5’);
alter table smartdb.smart_company_daily_dws drop partition(dt=‘HIVE_DEFAULT_PARTITION’);
msck repair table smartdb.smart_company_daily_dws;
没想到连分区文件夹都不在了,show partitons这五个分区居然还在

3.尝试改变此分区字段的数据类型,然后再drop partition
一开始先
alter table smartdb.smart_company_daily_dws change column dt dt string;
报错
在这里插入图片描述
后来发现更改分区字段的数据类型命令不同,然后使用
ALTER TABLE smartdb.smart_company_daily_dws PARTITION COLUMN (dt string);
成功将分区字段数据类型改为string
然后使用drop partition命令可以删除异常分区

  • 出现新问题

使用
ALTER TABLE smartdb.smart_company_daily_dws PARTITION COLUMN (dt date);
将分区字段数据类型改为date类型的时候报了如下错误
在这里插入图片描述
然后注意到报错信息中有in serial mode几个字
想把hive改为非严格模式再执行类型转换,但是失败了
解决方案见
https://blog.csdn.net/weixin_42913992/article/details/124827902?csdn_share_tail=%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22124827902%22%2C%22source%22%3A%22weixin_42913992%22%7D&ctrtid=GYXnr

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-05-24 18:15:37  更:2022-05-24 18:18:40 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 20:35:25-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码