[大数据] hadoop之HDFS安装配置

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> hadoop之HDFS安装配置 -> 正文阅读

[大数据]hadoop之HDFS安装配置

准备工作

是否安装JDK

是否配置静态IP? ?配置 IP和主机名映射 (根目录输入 vi /etc/hosts）

检查虚拟机时间是否同步，输入date查看

关闭防火墙： systemctl disable firewalld?

1.免密设置

ssh one  先连接需要免密的服务器，输入yes
	exit     退出
	cd .ssh
	ssh-keygen -t rsa  四个回车（可能要输y）
	ssh-copy-id two three four five（四个虚拟机名字）要免密哪台就输哪台的名字
	ssh nodetwo  测试连接，如不需要密码就是免密成功 exit退出

2.安装依赖软件

yum -y install ssh rsync

3.安装hdfs

解压：tar -zxvf hadoop-2.6.0-cdh5.14.2.tar.gz

修改文件夹名称为 hadoop ，即hadoop安装目录，执行修改文件夹名称命令

mv hadoop-2.6.0 hadoop

hadoop配置文件的修改：

cd /opt/install/hadoop/etc/hadoop

vi hadoop-env.sh

在任意位置里添加以下内容  (建议在最底部)

export JAVA_HOME=/opt/install/jdk     ---jdk安装路径

配置namenode的位置：

vi core-site.xml

在<configuration>中添加	
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://nodetwo:9000</value>
    </property>
	<property>
        <name>hadoop.tmp.dir</name>
        <value>/var/cdh/hadoop/</value>
    </property>
     <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>five:50090</value>
    </property>
配置数据的存放位置和副本数，这里设置为2（2为随意设置的）:

vi hdfs-site.xml

在<configuration>中添加
    <property>
        <name>dfs.replication</name>
        <value>2</value>
    </property>

添加其余虚拟机名字：（删除localhost）

vi slaves 

--例如我的虚拟机名字是这三个	
	four 
	five 
	six

配置环境变量：（根目录输入）

vi /etc/profile

export JAVA_HOME=/opt/install/jdk            （jdk安装路径）
export HADOOP_HOME=/opt/install/hadoop       （hadoop安装路径）
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

5、上传配置信息到其余三台虚拟机

cd /opt/

scp -r install/ four:`pwd`   （four指其余三台虚拟机的名字，每台都要上传）
scp -r install/ five:`pwd`
scp -r install/ six:`pwd`

6、格式化文件系统（仅第一次执行即可，不要重复执行）

hdfs namenode -format

在最后几行内看到有以下代码说明成功

INFO common.Storage: Storage directory /var/cdh/hadoop/dfs/name has been successfully formatted.

7、一键启动hdfs:

start-dfs.sh

8、验证是否启动成功：

输入 jps 会出现以下内容

NameNode
SecondaryNameNode
Jps

9、web端口访问

网址输入：本机IP地址 :50070 进入hadoop页面

如：192.168.10.25:50070

10、上传环境变量：

scp /etc/profile four:/etc/profile   （four指其余三台虚拟机的名字，每台都要上传）

Hadoop集群启动方式：

1、单节点启动：

hadoop-daemon.sh start namenode (HDFS的进程)   start换成stop是结束进程
yarn-daemon.sh start nodemanager (YARN的进程)  start换成stop是结束进程

2、一键启动：

start-dfs.sh  (HDFS的进程) 

输入jps启动进程包括 SecondaryNameNode  NameNode  NodeManager  Jps

start-yarn.sh (YARN的进程) 

输入jps启动进程包括 SecondaryNameNode  NameNode  NodeManager ResourceManager Jps

3、如果用start-all.sh会提示：

 This script is Deprecated.  Instead use start-dfs.sh and start-yarn.sh
（此脚本已弃用。 推荐使用start-dfs.sh和start-yarn.sh  ）

4、如果要停止hdfs代码为

sbin/stop-dfs.shsn

通过UI来查看hadoop运行状态

1、查看HDFS的运行状态：http://namenode对应的主机IP地址：50070

2、查看HDFS的运行状态：http://resourcemanager对应的主机IP地址：8088

大数据最新文章

实现Kafka至少消费一次

亚马逊云科技：还在苦于ETL？Zero ETL的时代

初探MapReduce

【SpringBoot框架篇】32.基于注解+redis实现

Elasticsearch：如何减少 Elasticsearch 集

Go redis操作

Redis面试题

专题五 Redis高并发场景

基于GBase8s和Calcite的多数据源查询

Redis——底层数据结构原理

加:2021-08-24 15:37:49 更:2021-08-24 15:40:15

360图书馆购物三丰科技阅读网日历万年历 2026年5日历

-2026/5/11 4:39:11-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码