| |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| -> 大数据 -> 【HBASE】记一次HBase进行数据迁移,重建元数据 -> 正文阅读 |
|
|
[大数据]【HBASE】记一次HBase进行数据迁移,重建元数据 |
前情提要由于早期部署人员和架构上留下的大坑,我们集群的RegionServer组件和其他组件共机严重,服务器负载高时,直接会导致RegionServer断联,出现永久RIT的情况,而且hbck无论怎么修复都不行,虽然业务对hbase的数据需求不是特别的严格,但是有时候应付演示也是要用的,在现有架构难以变动的情况下,想到提供一个小型的同版本集群,进行原始数据拷贝和region重建的工作进行尝试。 正文数据迁移首先要将远端Hbase存在HDFS上的数据进行迁移,这里直接使用distcp工具进行拷贝,拷贝前先确认对端的数据和本地要拷贝的数据目录,一般来说都是
重建元数据这里也是直接使用hbase hbck工具进行元数据的重建,这里采用的是单个表单个表的进行:
测试查询随便scan一下,因为现在locality不够,所以可能查询会比较慢,这个会慢慢好的: 后续的表修复Multiple regions have the same startkey最大的问题就是,原来的数据就已经有问题了,导致我迁移过来以后重建元数据依旧有问题!最恶心的就是
该脚本会在完成后打印出需要分别在hbase shell和hdfs中执行的命令: Region not listed in hbase:meta or deployed on any region server.修复使用fixMeta进行:
Region state=FAILED_OPEN如果出现这种问题,最好hbck detail一下,查看具体原因:
Region not deployed on any region server
There is an overlap in the region chain
Region found in META, but not in HDFS or deployed on any region server
拷贝过程的其它问题Distcp失败有一个表在拷贝的时候,出现异常,任务刚提交没多久就失败,报错是有没法get对应的文件:
于是我也尝试使用openforwrite检查,发现确实对应的块是CORRUPT状态: Distcp调优使用Distcp过程中,遇到数据同步比较慢的情况,尝试了一些参数,直观感受是提高了同步速度,记录一下:
最终使用命令:
|
|
|
|
|
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年11日历 | -2025/11/25 1:24:57- |
|
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |