IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> hadoop之HDFS安装配置 -> 正文阅读

[大数据]hadoop之HDFS安装配置

准备工作

是否安装JDK

是否配置静态IP? ?配置 IP和主机名映射 (根目录输入 vi /etc/hosts)

检查虚拟机时间是否同步,输入date查看

关闭防火墙: systemctl disable firewalld?

1.免密设置

ssh one  先连接需要免密的服务器,输入yes
	exit     退出
	cd .ssh
	ssh-keygen -t rsa  四个回车(可能要输y)
	ssh-copy-id two three four five(四个虚拟机名字)要免密哪台就输哪台的名字
	ssh nodetwo  测试连接,如不需要密码就是免密成功 exit退出

2.安装依赖软件

yum -y install ssh rsync

3.安装hdfs

解压:tar -zxvf hadoop-2.6.0-cdh5.14.2.tar.gz

修改文件夹名称为 hadoop ,即hadoop安装目录,执行修改文件夹名称命令

mv hadoop-2.6.0 hadoop

hadoop配置文件的修改:

cd /opt/install/hadoop/etc/hadoop

vi hadoop-env.sh

在任意位置里添加以下内容  (建议在最底部)

export JAVA_HOME=/opt/install/jdk     ---jdk安装路径

配置namenode的位置:

vi core-site.xml

在<configuration>中添加	
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://nodetwo:9000</value>
    </property>
	<property>
        <name>hadoop.tmp.dir</name>
        <value>/var/cdh/hadoop/</value>
    </property>
     <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>five:50090</value>
    </property>
配置数据的存放位置和副本数,这里设置为2(2为随意设置的):
vi hdfs-site.xml

在<configuration>中添加
    <property>
        <name>dfs.replication</name>
        <value>2</value>
    </property>

添加其余虚拟机名字:(删除localhost)

vi slaves 

--例如我的虚拟机名字是这三个	
	four 
	five 
	six

配置环境变量:(根目录输入)

vi /etc/profile

export JAVA_HOME=/opt/install/jdk            (jdk安装路径)
export HADOOP_HOME=/opt/install/hadoop       (hadoop安装路径)
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

5、上传配置信息到其余三台虚拟机

cd /opt/

scp -r install/ four:`pwd`   (four指其余三台虚拟机的名字,每台都要上传)
scp -r install/ five:`pwd`
scp -r install/ six:`pwd`

6、格式化文件系统(仅第一次执行即可,不要重复执行)

hdfs namenode -format

在最后几行内看到有以下代码说明成功

INFO common.Storage: Storage directory /var/cdh/hadoop/dfs/name has been successfully formatted.	

7、一键启动hdfs:

start-dfs.sh

8、验证是否启动成功:

输入 jps 会出现以下内容

NameNode
SecondaryNameNode
Jps

9、web端口访问

网址输入:本机IP地址 :50070 进入hadoop页面

如:192.168.10.25:50070

10、上传环境变量:

scp /etc/profile four:/etc/profile   (four指其余三台虚拟机的名字,每台都要上传)

Hadoop集群启动方式:

1、单节点启动:

hadoop-daemon.sh start namenode (HDFS的进程)   start换成stop是结束进程
yarn-daemon.sh start nodemanager (YARN的进程)  start换成stop是结束进程

2、一键启动:

start-dfs.sh  (HDFS的进程) 

输入jps启动进程包括 SecondaryNameNode  NameNode  NodeManager  Jps

start-yarn.sh (YARN的进程) 

输入jps启动进程包括 SecondaryNameNode  NameNode  NodeManager ResourceManager Jps

3、如果用start-all.sh会提示:

 This script is Deprecated.  Instead use start-dfs.sh and start-yarn.sh
(此脚本已弃用。 推荐使用start-dfs.sh和start-yarn.sh  )

4、如果要停止hdfs代码为

sbin/stop-dfs.shsn

通过UI来查看hadoop运行状态

1、查看HDFS的运行状态:http://namenode对应的主机IP地址 :50070

2、查看HDFS的运行状态:http://resourcemanager对应的主机IP地址 :8088

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-24 15:37:49  更:2021-08-24 15:40:15 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 13:34:23-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码