IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Hadoop集群搭建(分布式版本) -> 正文阅读

[大数据]Hadoop集群搭建(分布式版本)

一、准备工作

1、准备三台虚拟机:

master、node1、node2

2、时间同步

1)、查看本地时间

date

2)、删除本地时间

rm -f /etc/localtime

3)、复制时区文件到localtime

cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime

4)、安装插件ntpdate

yum install -y ntpdate

5)、将本地时间与网络时间同步

ntpdate -u?ntp.api.bz

6)、再次查看时间

date

7)、保存配置

hwclock -w

8)、重启

reboot

9)、再次查看时间

date

3、检查jdk的安装jdk1.8

java -version

4、修改主机名

三台分别执行 vim /etc/hostname 并将内容指定为对应的主机名

5、关闭防火墙

关闭防火墙:

systemctl stop firewalld

查看防火墙状态:

systemctl status firewalld

取消防火墙自启:

systemctl disable firewalld

6、静态IP配置

1)直接使用图形化界面配置(不推荐)

2)手动编辑配置文件进行配置

编辑网络配置文件

vim /etc/sysconfig/network-scripts/ifcfg-ens33

TYPE=Ethernet

BOOTPROTO=static

HWADDR=00:0C:29:E2:B8:F2

NAME=ens33 DEVICE=ens33

ONBOOT=yes

IPADDR=192.168.10.110

GATEWAY=192.168.10.2

NETMASK=255.255.255.0

DNS1=192.168.10.2

?DNS2=8.8.8.8

?需要修改:HWADDR(mac地址)

IPADDR(根据自己的网段,自定义IP地址)

GATEWAY(根据自己的网段填写对应的网关地址)

    • 2、关闭NetworkManager,并取消开机自启
    • systemctl stop NetworkManager
    • systemctl disable NetworkManager?
    • 3、重启网络服务systemctl restart network

7、免密登录

1)、生成密钥

ssh-keygen -t rsa#

2)、配置免密登录

ssh-copy-id master

ssh-copy-id node1

ssh-copy-id node2

3)、测试免密登录

ssh node1

8、配置好映射文件:

vim /etc/hosts

192.168.190.100 master

192.168.190.101 node1

192.168.190.102 node2

二、搭建Hadoop集群

1、上传安装包并解压

# 使用xftp上传压缩包至master的/usr/local/soft/packages/

cd /urs/local/soft/packages/

# 解压

tar -zxvf hadoop-2.7.6.tar.gz -C /usr/local/soft/

2、配置环境变量

vim /etc/profile ? JAVA_HOME=/usr/local/soft/jdk1.8.0_171 HADOOP_HOME=/usr/local/soft/hadoop-2.7.6 export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH ?

# 重新加载环境变量

source /etc/profile

3、修改Hadoop配置文件

1)、修改core-site.xml

vim core-site.xml

修改内容:

<property>

<name>fs.defaultFS</name>

<value>hdfs://master:9000</value>

</property> <property>

<name>hadoop.tmp.dir</name>

<value>/usr/local/soft/hadoop-2.7.6/tmp</value>

</property> <property>

<name>fs.trash.interval</name>

<value>1440</value>

</property>

2)、修改hadoop-env.sh

vim hadoop-env.sh

export JAVA_HOME=/usr/local/soft/jdk1.8.0_171

3)、修改hdfs-site.xml

vim hdfs-site.xml

修改内容:

<property>

<name>dfs.replication</name>

<value>1</value>

</property> <property>

<name>dfs.permissions</name>

<value>false</value>

</property>

4)编辑修改mapred-site.xml

注意:该配置文件初始为mapred-site.xml.template,需要修改为mapred-site.xml

vim mapred-site.xml

修改内容:

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property> <property>

<name>mapreduce.jobhistory.address</name>

<value>master:10020</value>

</property> <property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>master:19888</value>

</property>

5)、编辑修改slaves

vim slaves

修改内容:

node1 node2

6)、编辑修改yarn-site.xml

vim yarn-site.xml

修改内容:

<property>

<name>yarn.resourcemanager.hostname</name>

<value>master</value>

</property> <property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property> <property>

<name>yarn.log-aggregation-enable</name>

<value>true</value>

</property> <property>

<name>yarn.log-aggregation.retain-seconds</name>

<value>604800</value>

</property>

4、分发Hadoop到node1、node2

cd /usr/local/soft/

scp -r hadoop-2.7.6/ node1:`pwd`

scp -r hadoop-2.7.6/ node2:`pwd`

5、格式化namenode(第一次启动的时候需要执行)

hdfs namenode -format

6、启动Hadoop集群

start-all.sh

7、检查master、node1、node2上的进程

1)master

[root@master hadoop]# jps

17698 ResourceManager

17955 Jps

17356 NameNode 1

7548 SecondaryNameNode

2)node1

[root@node1 ~]# jps

10530 Jps

10293 DataNode

10409 NodeManager

3)node2

[root@node2 ~]# jps

10518 Jps 10281

DataNode

10397 NodeManager

8、访问HDFS的WEB界面

http://master:50070

9、访问YARN的WEB界面

http://master:8088

10、关闭Hadoop集群

stop-all.sh

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-29 21:52:17  更:2021-08-29 21:52:19 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 16:58:55-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码