| |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| -> 大数据 -> 大数据Hive ACID及类似产品 -> 正文阅读 |
|
|
[大数据]大数据Hive ACID及类似产品 |
|
Hive3.0后默认建立的表为事务表,支持update, merge对数据进行更新处理。下面是示例,可以看到参数'transactional'='true'。
Hive3之后数据的存储目录结构也进行了相应的调整: [root@node2 ~]# hdfs dfs -ls /warehouse/tablespace 许多开源项目都在解决多版本并发控制(MVCC, multi-version concurrency)以及对数据湖中的数据进行事务更新和删除。比较突出的几个产品包括:
?我们按照以下不同的维度对他们进行对比,但没有特定的顺序: 1.Support for updates and deletes 2.Support for compaction and cleanup 3.Support for Parquet and ORC formats 4.Support for Hive, Spark, and Presto 5.Support for SQL DML statements 6.Write amplification 7.Open source governance 下图总结了截至到2019年9月的一些对比,红色部分代表它们有一些问题,绿色部分则代表它们比较有优势。
通过上表,你可以发现如果要支持所有的特性,对Hive的改动会最小,具体来说只需要:
|
|
|
|
|
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年10日历 | -2025/10/28 6:40:45- |
|
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |