IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Hadoop 扩缩 -> 正文阅读

[大数据]Hadoop 扩缩

Hadoop 扩容

随着公司业务的增长,数据量越来越大,原有的数据节点的容量已经不能满足存储数据的需求,需要在原有集群基础上动态添加新的数据节点

配置新服务器的环境

根据以前的文档进行相应的配置

https://blog.csdn.net/qq_44226094/article/details/122685082

拷贝 /opt/ha/hadoop 目录和 /etc/profile.d/my_env.sh 到 cpu104

scp -r /opt/ha/hadoop-3.1.3/ cpu104:/opt/ha/

在这里插入图片描述

sudo scp /etc/profile.d/my_env.sh cpu104:/etc/profile.d/my_env.sh

在这里插入图片描述

source /etc/profile

在这里插入图片描述

删除 cpu104 上 Hadoop 的历史数据, data 和 log 数据

rm -rf data/ logs/

在这里插入图片描述

白名单 ( 可选 )

白名单:表示在白名单的主机 IP 地址可以,用来存储数据

企业中:配置白名单,可以尽量防止黑客恶意访问攻击

在这里插入图片描述

在 NameNode 节点的 /opt/ha/hadoop-3.1.3/etc/hadoop 目录下创建 whitelist

vim whitelist

在 whitelist 中添加如下主机名称

cpu101
cpu102
cpu103

在这里插入图片描述

在 hdfs-site.xml 配置文件中增加 dfs.hosts 配置参数

	<!-- 白名单 -->
	<property>
		<name>dfs.hosts</name>
		<value>/opt/ha/hadoop-3.1.3/etc/hadoop/whitelist</value>
	</property>

在这里插入图片描述

分发配置文件 whitelist, hdfs-site.xml

xsync hdfs-site.xml whitelist

在这里插入图片描述

第一次添加白名单必须重启集群

myhadoop.sh stop
myhadoop.sh start

不是第一次,只需要刷新 NameNode 节点

hdfs dfsadmin -refreshNodes

在 web 浏览器上查看 DN

在这里插入图片描述

在这里插入图片描述

添加新服务器

cpu104 直接启动 DataNode, 即可关联到集群

hdfs --daemon start datanode
yarn --daemon start nodemanager

在这里插入图片描述

在白名单中增加新服役的服务器

vim whitelist
cpu104

在这里插入图片描述

分发

xsync whitelist

在这里插入图片描述

刷新 NameNode

hdfs dfsadmin -refreshNodes
yarn rmadmin -refreshNodes

在这里插入图片描述

在这里插入图片描述

数据均衡

新服役的服务器数据量比较少,需要执行集群均衡命令

设置数据均衡带宽 ( 默认带宽是1M/s )

hdfs dfsadmin -setBalancerBandwidth 10485760

在这里插入图片描述

StandbyException): Operation category WRITE is not supported in state standby. 解决方案 :

https://blog.csdn.net/qq_44226094/article/details/123631166

开启数据均衡命令

start-balancer.sh -threshold 10
  • 10 : 集群中各个节点的磁盘空间利用率相差不超过 10%

在这里插入图片描述

停止数据均衡命令

stop-balancer.sh

由于 HDFS 需要启动单独的 Rebalance Server 来执行 Rebalance 操作, 所以尽量不要在 NameNode 上执行 start-balancer.sh ,而是找一台比较空闲的机器

Hadoop 缩容

黑名单

黑名单:在黑名单的主机 IP 地址不可以存储数据

企业中:配置黑名单,用来退役服务器

编辑 /opt/ha/hadoop-3.1.3/etc/hadoop 目录下的 blacklist 文件

vim blacklist
cpu104

在这里插入图片描述

在 hdfs-site.xml 配置文件中增加 dfs.hosts 配置参数

	<!-- 黑名单 -->
	<property>
		<name>dfs.hosts.exclude</name>
		<value>/opt/ha/hadoop-3.1.3/etc/hadoop/blacklist</value>
	</property>

在这里插入图片描述

分发配置文件 blacklist, hdfs-site.xml

xsync hdfs-site.xml blacklist

在这里插入图片描述

第一次添加黑名单必须重启集群

myhadoop.sh stop
myhadoop.sh start

不是第一次,只需要刷新 NameNode 节点

 hdfs dfsadmin -refreshNodes
yarn rmadmin -refreshNodes

检查 Web 浏览器,退役节点的状态为 decommission in progress(退役中), 说明数据节点正在复制块到其他节点

在这里插入图片描述

在这里插入图片描述

等待退役节点状态为 decommissioned(所有块已经复制完成), 再停止该节点及节点资源管理器

如果副本数是 3, 服役的节点小于等于 3,是不能退役成功的,需要修改副本数后才能退役

hdfs --daemon stop datanode
yarn --daemon stop nodemanager

在这里插入图片描述

如果数据不均衡,可以用命令实现集群的再平衡

start-balancer.sh -threshold 10
  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-03-22 20:40:57  更:2022-03-22 20:44:27 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 7:08:37-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码