[大数据] HBase架构、读写流程、rowkey设计、预分区、Region Split

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> HBase架构、读写流程、rowkey设计、预分区、Region Split -> 正文阅读

[大数据]HBase架构、读写流程、rowkey设计、预分区、Region Split

一、HBase 架构

二、Hbase 读写流程

三、StoreFile Compaction

四、Region Split

五、预分区

六、ROWKey设计

一、HBase 架构

HLOG里面有 master、regionserver、wal(预写日志)
当有数据来了之后先查询HMaster 来获取向哪个HRegionserver中插入数据
数据来了之后先向HLog中写，然后写到Mem Store，达到默认64MB之后写入HFile

二、Hbase 读写流程

三、StoreFile Compaction

Compaction 分为两种，分别是Minor Compaction和 Major Compaction 。Minor Compaction会将临近的若干个较小的HFile合并成一个较大的HFile。但不会清理过期和删除的数据。Major Compaction 会将一个Store 下的所有的HFile合并成一个大HFile，并且会清理掉过期和删除的数据

四、Region Split

默认情况下，每个Table起初只有一个Region，随着数据的不断写入，Region会自动进行拆分。刚拆分时，两个子Region都位于当前Region Server，但处于负载均衡的考虑，HMaster有可能会将某个Region转移给其他的Region Server。

Region Split 时机配置在 hbase-site.xml

?    1. 当1个region中的某个Store下所有StoreFile的总大小超过  ==hbase.hregion.max.filesize== 该Region就会进行拆分  （0.94版本前）
?    2. 当1个region中的某个Store下所有StoreFile的总大小超过 ==Min(R^3 * 2 * "hbase.hregion.memstore.flush.size",hbase.hregion.max.filesize)== ,该Region就会进行拆分，其中R为当前Region Server中属于该Table的个数 （0.94版本后）
?    3. HBase2.0引入了新的Split策略：如果当前RegionServer上改表只有一个Region按照 ==2 * hbase.hregion.memstore.flush.size== 分裂，否则按照==hbase.hregion.max.filesize== 分裂

五、预分区

每一个region维护着StartRow与EndRow，如果加入的数据符合某个Region维护的RowKey范围，则该数据交给这个Region维护。那么依照这个原则，我们可以将数据索要投放的分区提前大致的规划好，以提高HBase性能。

?    1. 手动预分区
?    2. 生成16进制序列预分区
?    3. 按照文件设置的规则预分区

六、ROWKey设计

一条数据的唯一标识就是RowKey，那么这条数据存储与哪个分区，取决于RowKey处于哪一个预分区的区间内，设计RowKey的主要目的就是让数据均匀的分布于所有的region中，在一定的程度上防止数据倾斜。

生成随机数、hash、散列值（加盐）
字符串反转
字符串拼接

大数据最新文章

实现Kafka至少消费一次

亚马逊云科技：还在苦于ETL？Zero ETL的时代

初探MapReduce

【SpringBoot框架篇】32.基于注解+redis实现

Elasticsearch：如何减少 Elasticsearch 集

Go redis操作

Redis面试题

专题五 Redis高并发场景

基于GBase8s和Calcite的多数据源查询

Redis——底层数据结构原理

加:2021-08-22 13:36:15 更:2021-08-22 13:38:58

360图书馆购物三丰科技阅读网日历万年历 2026年4日历

-2026/4/28 20:56:56-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码