| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> Hive orc与parquet的区别 orc如何支持事物 -> 正文阅读 |
|
[大数据]Hive orc与parquet的区别 orc如何支持事物 |
区别: 1 orc的数据存储的文件更小。 2 orc支持事物(ACID和delete/update操作,当然还需要满足其他条件才行。)parquet不支持增删改。 ---------------------------------------------------------- 因为业务要求,需要对Hive表进行delete,在官网查询后,发现update和delete是一类问题。在此总结下如何实现Hive表的delete和update。 首先,先看下官网关于update和delete的相关说明,使用注意事项也请参考官网说明,这里只介绍如何实现相关功能。 综合上述信息,Hive自0.14版本开始支持update和delete,要执行update和delete的表必须支持ACID,而关于ACID的详细介绍,需要查看Hive Transactions. 经过对Hive Transactions相关内容的分析,我提取出了以下必要信息: ? 综合上述信息,可以得出以下结论: 如果一个表要实现update和delete功能,该表就必须支持ACID,而支持ACID,就必须满足以下条件: 1、表的存储格式必须是ORC(STORED AS ORC); 2、表必须进行分桶(CLUSTERED BY (col_name, col_name, ...)??INTO num_buckets BUCKETS); 3、Table property中参数transactional必须设定为True(tblproperties('transactional'='true')); 4、以下配置项必须被设定: Client端:
?? 服务端:
? ? ? ?注意:上述配置项必须区分Client端和服务端。在Cloudera Manager上可以分别添加(hive—>配置—>高级),在更新部署配置信息的时候需要勾选部署客户端配置(默认是勾选的)。 https://blog.csdn.net/u010003835/article/details/88249027?《Hive_Hive ORC 实现 update 与 delete》 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/23 16:56:44- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |