IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Hadoop 集群搭建,云服务器 -> 正文阅读

[大数据]Hadoop 集群搭建,云服务器

先安装JDK与Hadoop

cd $HADOOP_HOME/etc/hadoop

=============core-site.xml

<configuration>
	<property> 
		<name>fs.default.name</name> 
		<value>hdfs://master:9000</value> 
	</property> 
	<property> 
		<name>hadoop.tmp.dir</name> 
		<value>file:/opt/module/hadoop-3.3.1/temp</value> 
	</property> 
	<property> 
		<name>io.file.buffer.size</name> 
		<value>131072</value> 
	</property>
</configuration>

===========hdfs-site.xml

<configuration>
	<property>
		<name>dfs.namenode.name.dir</name>
		<value>file:/opt/module/hadoop-3.3.1/data/dfs/data</value>
	</property>
	<property>
		<name>dfs.datanode.data.dir</name>
		<value>file:/opt/module/hadoop-3.3.1/data/dfs/data</value>
	</property>
	<property>
		<name>dfs.replication</name>
		<value>2</value>
	</property>
	<property>
		<name>dfs.permissions</name>
		<value>false</value> <description>need not permissions</description>
	</property>
	<property>
		<name>dfs.namenode.http-address</name>
		<value>master:50070</value>
	</property>
	<property>
        		<name>dfs.namenode.secondary.http-address</name>
        		<value>slave:9868</value>
    	</property>
</configuration>

==============yarn-site.xml

<configuration>
	<!-- Site specific YARN configuration properties --> 
	<property> 
		<name>yarn.resourcemanager.hostname</name> 
		<value>slave</value> 
	</property> 
	<property> 
		<description>The address of the applications manager interface in the RM.</description> 
		<name>yarn.resourcemanager.address</name> 
		<value>slave:8032</value> 
	</property> 
	<property> 
		<description>The address of the scheduler interface.</description> 
		<name>yarn.resourcemanager.scheduler.address</name> 
		<value>slave:8030</value> 
	</property> 
	<property> 
		<description>The http address of the RM web application.</description> 
		<name>yarn.resourcemanager.webapp.address</name> 
		<value>slave:18088</value> 
	</property> 
	<property> 
		<description>The https adddress of the RM web application.</description> 
		<name>yarn.resourcemanager.webapp.https.address</name> 
		<value>slave:18090</value> 
	</property> 
	<property> 
		<name>yarn.resourcemanager.resource-tracker.address</name> 
		<value>slave:8031</value> 
	</property> 
	<property> 
		<description>The address of the RM admin interface.</description> 
		<name>yarn.resourcemanager.admin.address</name> 
		<value>slave:8033</value> 
	</property> 
	<property> 
		<name>yarn.nodemanager.aux-services</name> 
		<value>mapreduce_shuffle</value> 
	</property>
</configuration>

=========mapred-site.xml

<configuration> 
	<property> 
		<name>mapreduce.framework.name</name> 
		<value>yarn</value> 
	</property> 
	<property> 
		<name>mapred.job.tracker</name> 
		<value>master:9001</value> 
	</property>
</configuration>

==========只需要添加worker节点的信息即可
vim /opt/module/hadoop-3.1.3/etc/hadoop/workers

情况:master : master_ip
worker : slave_ip

slave_ip(这种情况只需要添加这个IP到两个节点的worker配置文件中)

=====执行生效
source /etc/profile

======== 配置文件地址
/opt/module/hadoop-3.3.1/etc/hadoop

====添加主机列表,每个节点只需要添加其他节点的信息就好,不需要添加本身的ip。
vi /etc/hosts
master_ip master
slave_ip slave

========######第一次启动NameNode需要先进行格式化
cd /opt/module/hadoop-3.3.1/
/opt/module/hadoop-3.3.1/bin/hdfs namenode -format

=====配置在/etc/profile环境变量中
export HADOOP_COMMON_LIB_NATIVE_DIR= H A D O O P H O M E / l i b / n a t i v e e x p o r t H A D O O P O P T S = " ? D j a v a . l i b r a r y . p a t h = HADOOP_HOME/lib/native export HADOOP_OPTS="-Djava.library.path= HADOOPH?OME/lib/nativeexportHADOOPO?PTS="?Djava.library.path=HADOOP_HOME/lib/native"

=====将节点间的公钥进行分享,即可使用主机名相互访问。
SSH免密登录
SSH免密登录是为了各个服务器之间访问不在需要密码。两台台服务器分别执行一遍如下命令。执行完该命令会在root/.ssh下生成密钥。
ssh-keygen -t rsa

#在slave id_rsa.pub发送到主机上,并重新命令
scp id_rsa.pub root@master:~/.ssh/id_rsa.pub.slave

在主机root/.ssh下把id_rsa.pub、id_rsa.pub.slave追加到authorized_keys中。
cat id_rsa.pub >> authorized_keys
cat id_rsa.pub.slave >> authorized_keys

然后把authorized_keys传回到slave1
scp authorized_keys root@slave:~/.ssh

最后修改文件权限。

chmod 755 ~
chmod 700 ~/.ssh
chmod 600 ~/.ssh/authorized_keys

====添加信息到$HADOOP_HOME/etc/hadoop/hadoop-env.sh
export HADOOP_SHELL_EXECNAME=root
export HDFS_NAMENODE_USER=root

====启动
/opt/module/hadoop-3.3.1/sbin/start-dfs.sh
/opt/module/hadoop-3.3.1/sbin/start-yarn.sh
/opt/module/hadoop-3.3.1/sbin/start-all.sh

====关闭
/opt/module/hadoop-3.3.1/sbin/stop-dfs.sh
/opt/module/hadoop-3.3.1/sbin/stop-yarn.sh
/opt/module/hadoop-3.3.1/sbin/stop-all.sh

=====NameNode节点的访问地址

http://master:50070/
http://slave:8088/

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-03-13 21:52:47  更:2022-03-13 21:54:39 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/16 19:00:25-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码