IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Hadoop 安装部署 -> 正文阅读

[大数据]Hadoop 安装部署

官网下载软件:
Ubuntu : https://releases.ubuntu.com/
jdk : https://www.oracle.com/java/technologies/downloads/
Hadoop : https://archive.apache.org/dist/hadoop/common/hadoop-3.3.2/

下载后上传到服务器,解压

1. 关闭防火墙

sudo ufw disable

查看防火墙状态,状态为“不活动”,说明防火墙已经关闭

sudo ufw status

在这里插入图片描述

2. ssh 安装

(1)安装SSH客户端软件

检查是否已安装

  sudo dpkg -l | grep ssh

安装:

sudo apt-get install openssh-client`在这里插入代码片`

在这里插入图片描述

(2)安装SSH服务端软件

 sudo apt-get install openssh-server

在这里插入图片描述

重启:

sudo /etc/init.d/ssh restart

在这里插入图片描述

(3)免密登录设置

生成密钥对 , 一路回车

ssh-keygen -t rsa

在这里插入图片描述

查看

ls ~/.ssh

在这里插入图片描述

追加公钥

cat .ssh/id_rsa.pub >> .ssh/authorized_keys
chmod 600 .ssh/authorized_keys

在这里插入图片描述

查看

ls ~/.ssh

在这里插入图片描述

免密登录验证

~/.ssh$ ssh node1

在这里插入图片描述

退出

exit

在这里插入图片描述

3. JDK

  1. 解压,更名,建立软连接
    在这里插入图片描述

  2. 配置JDK环境变量

vim  ~/.bashrc

追加

export JAVA_HOME=~/jdk
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:. 
export PATH=${JAVA_HOME}/bin:$PATH

在这里插入图片描述

使配置生效

source ~/.bashrc

验证
在这里插入图片描述

四. Hadoop

1. 更改主机名

查看主机名

 hostname

在这里插入图片描述

更改主机名

sudo vim /etc/hostname 

在这里插入图片描述
在这里插入图片描述

重启
在这里插入图片描述

(2)映射IP地址及主机名

sudo vim /etc/hosts

在这里插入图片描述
在这里插入图片描述

追加

192.168.30.128	    node1

在这里插入图片描述

(3)设置Hadoop配置文件

解压,改名称
设置环境变量

vi ~/.bashrc 

在这里插入图片描述

追加

export HADOOP_HOME=~/hadoop
export PATH=${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin:$PATH

在这里插入图片描述

使配置生效
输入 hadoop 验证

source ~/.bashrc

在这里插入图片描述

2. 配置 hadoop 相关 文件

在 hadoop 的 etc/hadoop 下
在这里插入图片描述

(1) hadoop-env.sh

 cd ~/hadoop/etc/hadoop
 vi hadoop-env.sh

在这里插入图片描述

找到export JAVA_HOME一行,把行首的#去掉,并按实际修改JAVA_HOME的值。

# The java implementation to use.
export JAVA_HOME=/home/hadoop/jdk

在这里插入图片描述

(2) .core-site.xml

vi core-site.xml

在这里插入图片描述

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://node1:8020</value>
        <!-- 以上ip地址或主机名要按实际情况修改 -->
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/hadoop/hadoop/tmp</value>
    </property>
</configuration>

在这里插入图片描述

PS : /home/hadoop/hadoop/tmp 这个目录是不存在的,要自己创建一个,如果后面jps验证后出不来,就试试加权限

(3) 配置hdfs-site.xml

vi hdfs-site.xml

在这里插入图片描述

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
		<property>
			<name>dfs.replication</name>
			<value>1</value>
		</property>
</configuration>

在这里插入图片描述
dfs.replication的默认值是3,因为伪分布式只有一个节点,所以值设置为1

(4) 配置mapred-site.xml

复制mapred-site.xml.template,生成mapred-site.xml

cp mapred-site.xml.template mapred-site.xml

在这里插入图片描述

打开mapred-site.xml

vi mapred-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

在这里插入图片描述

mapreduce.framework.name默认值为local,设置为yarn,让MapReduce程序运行在YARN框架上

(5) 配置yarn-site.xml

vi yarn-site.xml

在这里插入图片描述

<?xml version="1.0"?>
<configuration>
        <property>
            <name>yarn.resourcemanager.hostname</name>
            <value>node1</value>
            <!-- 以上主机名或IP地址按实际情况修改 -->
        </property>
        <property>
            <name>yarn.nodemanager.aux-services</name>
            <value>mapreduce_shuffle</value>
        </property>
</configuration>

在这里插入图片描述

PS:
通过以上设置,我们完成了Hadoop伪分布式模式的配置。其实Hadoop可以配置的属性还有很多,没有配置的属性就用默认值,默认属性配置存放在core-default.xml、hdfs-default.xml、mapred-default.xml和yarn-default.xml文件中。可以到官网查询对应文档或通过命令 locate <查找的文件名> 来查找文件所在路径,再通过cat命令查看其内容

ps: 用locate 之前先更新

 locate core-default.xml
/home/hadoop/soft/hadoop-2.7.3/share/doc/hadoop/hadoop-project-dist/hadoop-common/core-default.xml

(6) 格式化HDFS

 hdfs namenode -format

在这里插入图片描述

sudo chmod 777 hadoop

在这里插入图片描述

(7) 启动Hadoop

启动HDFS

start-dfs.sh

用jps命令验证
在这里插入图片描述

启动YARN

start-yarn.sh

用jps命令验证多了两个

在这里插入图片描述

或者

start-all.sh

五 通过Web访问Hadoop

  1. HDFS Web界面

(1)在Windows浏览器中,输入网址http://192.168.100.129:50070,可以查看NameNode和DataNode的信息
在这里插入图片描述

(2)在Windows浏览器中,输入网址http://192.168.100.129:50090,可以查看SecondaryNameNode的信息
在这里插入图片描述

  1. YARN Web界面

在Ubuntu操作系统的浏览器中,输入网址http://192.168.100.129:8088,可以查看集群所有应用程序的信息
在这里插入图片描述

六 测试Hadoop

通过一个MapReduce程序测试Hadoop,统计HDFS中/input/data.txt文件内单词出现的次数

1.创建一个文本文件data.txt

cd ~
 vi data.txt

在这里插入图片描述

Hello World
Hello Hadoop

在这里插入图片描述

  1. 在HDFS创建input文件夹
hdfs dfs -mkdir /input

将data.txt上传到HDFS

 hdfs dfs -put data.txt /input

查看是否上传成功

hdfs dfs -ls /input

在这里插入图片描述

(5) 运行MapReduce WordCount例子

cd ~/hadoop/share/hadoop/mapreduce

注意 jar 版本

 hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount /input/data.txt /output

在这里插入图片描述

(6) 查看结果

hdfs dfs -cat /output/part-r-00000

在这里插入图片描述

(7) 停止Hadoop进程

stop-dfs.sh
stop-yarn.sh

或者

 stop-all.sh

在这里插入图片描述
至此,Hadoop伪分布式模式搭建完成

PS: 由于是后期整理的笔记,IP与主机名,目录路径可能存在偏差,读者需多注意一下

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-03-22 20:40:57  更:2022-03-22 20:41:25 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/16 16:52:56-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码