[大数据] centos7安装完全分布式hadoop3.2

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> centos7安装完全分布式hadoop3.2 -> 正文阅读

[大数据]centos7安装完全分布式hadoop3.2

废话不多说，先准备三台centos7，然后开始安装

第一步。配置主机名

编辑/etc/hostname分别给三台虚拟机命名，我写的是master，slave1，slave2，接着重启虚拟机，使名称生效。

第二步。配置免密登录

首先，关闭防火墙：

systemctl stop firewalld

永久关闭：

systmctl disable firewalld

然后，在三台虚拟机上都配置/etc/hosts文件，在最后加入

192.168.196.128 master
192.168.196.129 slave1
192.168.196.130 slave2

然后分别在三台虚拟机上，使用ssh-keygen -t rsa命令生成ssh密钥
在maste主机r执行命令

cd /root/.ssh
cp id_rsa.pub authorized_keys

然后分别在slave1 ，slave2上执行命令 cat /root/.ssh/id_rsa.pub
并分别将 id_rsa.pub 内容复制粘贴到master的 authorized_keys上，保存退出

接着使用scp命令，将文件传输到其余两台虚拟机的.ssh目录下。

scp authorized_keys slave1:/root/.ssh
scp authorized_keys slave2:/root/.ssh

接着就可以试试使用ssh登录其他机器了

第三步。配置jdk与hadoop环境变量
分别在三台机器上创建software文件夹，上传jdk1.8，hadoop3.2的压缩包到software文件夹，解压缩jdk与hadoop

编辑环境变量
执行命令 vim /etc/profile
在最后追加环境变量
J

AVA_HOME=/software/jdk1.8
HADOOP_HOME=/software/hadoop3.2

export PATH=$PATH:${JAVA_HOME}/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

第四步。配置hadoop

建立存储文件夹。

mkdir /usr/local/hadoop
mkdir /usr/local/hadoop/data
mkdir /usr/local/hadoop/data/tmp
mkdir /usr/local/hadoop/dfs
mkdir /usr/local/hadoop/dfs/data
mkdir /usr/local/hadoop/dfs/name
mkdir /usr/local/hadoop/tmp

执行命令 cd /software/hadoop3.2/etc/hadoop

然后执行命令 vi hadoop-env.sh
修改这一行 export JAVA_HOME=/software/jdk1.8 #这里修改为jdk的JAVA_HOME路径

vi core-site.xml

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/usr/local/hadoop/tmp</value>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:9000</value>
    </property>
</configuration>

vi hdfs-site.xml

<configuration>
    <property>
        <name>dfs.namenode.http-address</name>
        <value>master:50070</value>
    </property>
    <property><!--namenode持久存储名字空间及事务日志的本地文件系统路径-->
        <name>dfs.namenode.name.dir</name>
        <value>/usr/local/hadoop/dfs/name</value>
     </property>
     <property><!--DataNode存放块数据的本地文件系统路径-->
         <name>dfs.datanode.data.dir</name>
         <value>/usr/local/hadoop/dfs/data</value>
     </property>
     <property><!--数据需要备份的数量，不能大于集群的机器数量，默认为3-->
        <name>dfs.replication</name>
        <value>2</value>
    </property>
</configuration>

vi yarn-site.xml

<configuration>
    <property><!--NodeManager上运行的附属服务，用于运行mapreduce-->
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.resourcemanager.webapp.address</name>
        <value>master:8088</value>
    </property>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
</property>

</configuration>

vi mapred-site.xml

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

vi workers 删除localhost改成

 slave1 
 slave2

分别先后执行如下命令
vi /software/hadoop3.2/sbin/start-yarn.sh
加入如下

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

然后 vi /software/hadoop3.2/sbin/stop-yarn.sh
加入

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

vi /software/hadoop3.2/sbin/start-dfs.sh
加入

HDFS_DATANODE_USER=root
HDFS_DATANODE_SECURE_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

接着 vi /software/hadoop3.2/sbin/stop-dfs.sh
加入一下几行（在开头添加下面几行）

HDFS_DATANODE_USER=root
HDFS_DATANODE_SECURE_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

然后通过scp命令将hadoop3.2发送到其他slave上

scp -r /software/hadoop3.2  root@slave1:/software/
scp -r /software/hadoop3.2 root@slave2:/software/

第五步，启动
进入bin目录格式化namenode

cd  /software/hadoop3.2/bin

执行命令 hadoop namenode -formatt

启动hadoop

cd  /software/hadoop3.2/sbin

执行命令

./start-all.sh

192.168.196.128:50070、192.168.196.128:8088查看是否正常运行

执行jps命令，如果master上有
1818 NameNode
2314 ResourceManager
2078 SecondaryNameNode
而slave上有
1818 NameNode
2314 ResourceManager
说明启动成功

参考文章
https://blog.csdn.net/qq_40421109/article/details/103563455

大数据最新文章

实现Kafka至少消费一次

亚马逊云科技：还在苦于ETL？Zero ETL的时代

初探MapReduce

【SpringBoot框架篇】32.基于注解+redis实现

Elasticsearch：如何减少 Elasticsearch 集

Go redis操作

Redis面试题

专题五 Redis高并发场景

基于GBase8s和Calcite的多数据源查询

Redis——底层数据结构原理

加:2021-11-10 12:28:04 更:2021-11-10 12:28:16

360图书馆购物三丰科技阅读网日历万年历 2026年1日历

-2026/1/2 8:10:29-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码