IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> HBase 大数据量迁移。hbase snapshot 快照方式数据迁移 -> 正文阅读

[大数据]HBase 大数据量迁移。hbase snapshot 快照方式数据迁移

hbase snapshot 快照方式数据迁移

前提

snapshot备份默认已开启(0.95版本之后默认开启,也可手动添加hbase-site.xml配置)

SnapShot 快照迁移流程

1.生成快照备份

// device 是table的名字,‘device_snapshot01’是备份快照名称
snapshot 'device','device_snapshot01'

2.查看快照

// Hbase中查看已经创建的快照
list_snapshots hdfs
// Hdfs中存储的 Hbase快照地址
hadoop fs -ls hdfs://127.0.0.1:8020/hbase/.hbase-snapshot/ 

3.迁移、传输快照

// 参数说明
-snapshot 快照名称
-copy-from 快照源位置
-copy-to 快照目标位置
-mappers map数量、并行度
-bandwidth 传输带宽

// 快照迁移命令
hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot \ 
-snapshot device_snapshot01 \
-copy-from hdfs://127.0.0.1:8020/hbase \
-copy-to hdfs://127.0.0.2:8020/hbase \
-mappers 16 \
-bandwidth 1024

4.目标集群查看快照迁移是否成功

5.恢复数据

//使表失效,变为不可用状态
disable 'device'
// 覆盖原表,需先在新环境创建同名表 
// 无需指定表名,直接通过快照中存储的表名信息恢复
restore_snapshot 'device_snapshot01'
//使表有效,可对其正常开始读写
enable 'device'
// 恢复到新表(指定快照名、表名)
clone_snapshot 'device_snapshot01','device_new'

SnapShot迁移问题记录

错误日志(一):

Can’t find hfile: 643c8e0f85e5487982241077ae245f34 in the real directory for the primary table.
或 Hfile文件不存在等FileNotFoundException

问题原因:

该问题的原因是从源集群复制过来的文件在目标集群上不存在,检查目标集群,可发现目标集群的NameNode上有出现未找到的文件,也就是说文件原来是存在的,但过程中又被删除了

解决方案:

CleanerChore线程清理archive目录是通过hbase-site.xmll配置项hbase.master.hfilecleaner.ttl控制的,默认是5分钟(单位:毫秒),大表的文件迁移远超5分钟。调到两小时以上的足够大值。
(迁移时可能需要分别修改新旧两个集群环境配置;失败后可删除.snapshot/.tmp/下快照文件重试)

错误日志(二):

org.apache.hadoop.hdfs.BlockMissingException: Could not obtain block hadoop集群的datanode节点出现宕机

问题原因:

创建快照超时

解决方案:

(hbase-site.xml添加并调整以下参数)
hbase.snapshot.region.timeout
hbase.snapshot.master.timeoutMillis

补充

表压缩 :major_compact
压缩整个区域(region)(可单独压缩列、列族) :major_compact ‘table’
刷新表(将mem中缓存刷入Hfile) :flush ‘table’

此外可能还会有 no such file 等问题,后续在Hbase专栏将单独说明~

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-08-19 19:12:48  更:2022-08-19 19:12:56 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/20 3:53:14-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码