IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> hadoop常用配置文件 -> 正文阅读

[大数据]hadoop常用配置文件

目录

Hadoop2.x配置:

1.hadoop-env.sh/yarn-env.sh/mapred-env.sh

2.core-site.xml

3.hdfs-site.xml

4.yarn-site.xml

5.mapred-site.xml

6.xsync

7.vim /etc/profile

8.myhadoop.sh

9.jpsall

Hadoop3.x配置:

1.core-site.xml

2.yarn-site.xml

3.mapred-site.xml

4.hdfs-site.xml

5.xsync

6.myhadoop.sh

7.jpsall

8. vim /etc/profile.d/my_env.sh


Hadoop2.x配置:

1.hadoop-env.sh/yarn-env.sh/mapred-env.sh

export JAVA_HOME=/opt/module/jdk1.8.0_144

2.core-site.xml

<!-- 指定HDFS中NameNode的地址 -->

<property>

<name>fs.defaultFS</name>

????<value>hdfs://hadoop15:9000</value>

</property>

<!-- 指定Hadoop运行时产生文件的存储目录 -->

<property>

????????<name>hadoop.tmp.dir</name>

????????<value>/opt/module/hadoop-2.7.2/data/tmp</value>

</property>

3.hdfs-site.xml

<!-- 指定HDFS副本的数量 -->

<property>

????????<name>dfs.replication</name>

????????<value>3</value>

</property>

<!-- 指定Hadoop辅助名称节点主机配置 -->

<property>

??????<name>dfs.namenode.secondary.http-address</name>

??????<value>hadoop17:50090</value>

</property>

4.yarn-site.xml

<!-- Reducer获取数据的方式 -->

<property>

????????<name>yarn.nodemanager.aux-services</name>

????????<value>mapreduce_shuffle</value>

</property>

<!-- 指定YARN的ResourceManager的地址 -->

<property>

????????<name>yarn.resourcemanager.hostname</name>

????????<value>hadoop16</value>

</property>

<!-- 日志聚集功能使能 -->

<property>

????????<name>yarn.log-aggregation-enable</name>

????????<value>true</value>

</property>

<!-- 日志保留时间设置7天 -->

<property>

????????<name>yarn.log-aggregation.retain-seconds</name>

????????<value>604800</value>

</property>

5.mapred-site.xml

<!-- 指定MR运行在YARN上 -->

<property>

????????<name>mapreduce.framework.name</name>

????????<value>yarn</value>

</property>

<!-- 历史服务器端地址 -->

<property>

????????<name>mapreduce.jobhistory.address</name>

????????<value>hadoop15:10020</value>

</property>

<!-- 历史服务器web端地址 -->

<property>

????????<name>mapreduce.jobhistory.webapp.address</name>

????????<value>hadoop15:19888</value>

</property>

6.xsync

#!/bin/bash

#1 获取输入参数个数,如果没有参数,直接退出

pcount=$#

if((pcount==0)); then

echo no args;

exit;

fi

#2 获取文件名称

p1=$1

fname=`basename $p1`

echo fname=$fname

#3 获取上级目录到绝对路径

pdir=`cd -P $(dirname $p1); pwd`

echo pdir=$pdir

#4 获取当前用户名称

user=`whoami`

#5 循环

for((host=16; host<18; host++)); do

????????echo ------------------- hadoop$host --------------

????????rsync -rvl $pdir/$fname $user@hadoop$host:$pdir

done

7.vim /etc/profile

#JAVA_HOME

export JAVA_HOME=/opt/module/jdk1.8.0_144

export PATH=$PATH:$JAVA_HOME/bin

#HADOOP_HOME

export HADOOP_HOME=/opt/module/hadoop-2.7.2

export PATH=$PATH:$HADOOP_HOME/bin

export PATH=$PATH:$HADOOP_HOME/sbin

8.myhadoop.sh

#!/bin/bash

if [ $# -lt 1 ]

then

????????echo "No Args Input..."

????????exit ;

fi

case $1 in

"start")

????????echo " =================== 启动 hadoop 集群 ==================="

????????echo " --------------- 启动 hdfs ---------------"

????????ssh hadoop15 "/opt/module/hadoop-2.7.2/sbin/start-dfs.sh"

????????echo " --------------- 启动 yarn ---------------"

????????ssh hadoop16 "/opt/module/hadoop-2.7.2/sbin/start-yarn.sh"

????????echo " --------------- 启动 historyserver ---------------"

????????ssh hadoop15 "/opt/module/hadoop-2.7.2/sbin/mr-jobhistory-daemon.sh?start historyserver"

;;

"stop")

????????echo " =================== 关闭 hadoop 集群 ==================="

????????echo " --------------- 关闭 historyserver ---------------"

????????ssh hadoop15 "/opt/module/hadoop-2.7.2/sbin/mr-jobhistory-daemon.sh?start historyserver"

????????echo " --------------- 关闭 yarn ---------------"

????????ssh hadoop16 "/opt/module/hadoop-2.7.2/sbin/stop-yarn.sh" echo " --------------- 关闭 hdfs ---------------"

????????ssh hadoop15 "/opt/module/hadoop-2.7.2/sbin/stop-dfs.sh"

;;

*)

????????echo "Input Args Error..."

;;

esac

9.jpsall

#!/bin/bash

for host in hadoop15 hadoop16 hadoop17

do

????????echo =============== $host ===============

????????ssh $host /opt/module/jdkjdk1.8.0_144/bin/jps

done

Hadoop3.x配置:

1.core-site.xml

<!--指定NameNode的地址-->

<property>

????????<name>fs.defaultFS</name>

????????<value>hdfs://hadoop25:8020</value>

</property>

<!--指定hadoop数据的存储目录-->

<property>

????????<name>hadoop.tmp.dir</name>

????????<value>/opt/module/hadoop-3.1.3/data</value>

</property>

<!--配置HDFS网页登录使用的静态用户为atguigu -->

<property>

????????<name>hadoop.http.staticuser.user</name>

????????<value>real</value>

</property>

2.yarn-site.xml

<!-- 指定 MR 走 shuffle -->

<property>

????????<name>yarn.nodemanager.aux-services</name>

????????<value>mapreduce_shuffle</value>

</property>

<!-- 指定 ResourceManager 的地址-->

<property>

????????<name>yarn.resourcemanager.hostname</name>

????????<value>hadoop26</value>

</property>

<!-- 环境变量的继承 -->

<property>

????????<name>yarn.nodemanager.env-whitelist</name>

????????<value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CO NF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>

</property>

<!--开启日志聚集功能-->

<property>

????????<name>yarn.log-aggregation-enable</name>

????????<value>true</value>

</property>

<!--设置日志聚集服务器地址-->

<property>

????????<name>yarn.log.server.url</name>

????????<value>http://hadoop25:19888/jobhistory/logs</value>

</property>

<!--设置日志保留时间为7天-->

<property>

????????<name>yarn.log-aggregation.retain-seconds</name>

????????<value>604800</value>

</property>

3.mapred-site.xml

<!-- 指定 MapReduce 程序运行在 Yarn 上 -->

<property>

????????<name>mapreduce.framework.name</name>

????????<value>yarn</value>

</property>

<!--历史服务器端地址-->

<property>

????????<name>mapreduce.jobhistory.address</name>

????????<value>hadoop25:10020</value>

</property>

<!--历史服务器web端地址-->

<property>

????????<name>mapreduce.jobhistory.webapp.address</name>

????????<value>hadoop25:19888</value>

</property>

4.hdfs-site.xml

<!--nn web端访问地址-->

<property>

????????<name>dfs.namenode.http-address</name>

????????<value>hadoop25:9870</value>

</property>

<!--2nn web端访问地址-->

<property>

????????<name>dfs.namenode.secondary.http-address</name>

????????<value>hadoop27:9868</value>

</property>

5.xsync

#!/bin/bash

#1. 判断参数个数

if [ $# -lt 1 ]

then

????????echo Not Enough Arguement!

????????exit;

fi

#2. 遍历集群所有机器

for host in hadoop25 hadoop26 hadoop27

do

????????echo ==================== ?$host ?====================

????????#3. 遍历所有目录,挨个发送

????????for file in $@

????????do

????????????????#4. 判断文件是否存在

????????????????if [ -e $file ]

????????????????????????then

????????????????????????????????#5. 获取父目录

????????????????????????????????pdir=$(cd -P $(dirname $file); pwd)

????????????????????????????????#6. 获取当前文件的名称

????????????????????????????????fname=$(basename $file)

????????????????????????????????ssh $host "mkdir -p $pdir"

????????????????????????????????rsync -av $pdir/$fname $host:$pdir

????????????????????????else

????????????????????????????????echo $file does not exists!

????????????????fi

????????done

done

6.myhadoop.sh

#!/bin/bash

if [ $# -lt 1 ]

then

????????echo "No Args Input..."

????????exit ;

fi

case $1 in

"start")

????????echo " =================== 启动 hadoop 集群 ==================="

????????echo " --------------- 启动 hdfs ---------------"

????????ssh hadoop25 "/opt/module/hadoop-3.1.3/sbin/start-dfs.sh"

????????echo " --------------- 启动 yarn ---------------"

????????ssh hadoop26 "/opt/module/hadoop-3.1.3/sbin/start-yarn.sh"

????????echo " --------------- 启动 historyserver ---------------"

????????ssh hadoop25 "/opt/module/hadoop-3.1.3/bin/mapred --daemon start historyserver"

;;

"stop")

????????echo " =================== 关闭 hadoop 集群 ==================="

????????echo " --------------- 关闭 historyserver ---------------"

????????ssh hadoop25 "/opt/module/hadoop-3.1.3/bin/mapred --daemon stop historyserver"

????????echo " --------------- 关闭 yarn ---------------"

????????ssh hadoop26 "/opt/module/hadoop-3.1.3/sbin/stop-yarn.sh" echo " --------------- 关闭 hdfs ---------------"

????????ssh hadoop25 "/opt/module/hadoop-3.1.3/sbin/stop-dfs.sh"

;;

*)

????????echo "Input Args Error..."

;;

esac

7.jpsall

#!/bin/bash

for host in hadoop25 hadoop26 hadoop27

do

????????echo =============== $host ===============

????????ssh $host jps

done

8. vim /etc/profile.d/my_env.sh

#JAVA_HOME

export JAVA_HOME=/opt/module/jdk1.8.0_212

export PATH=$PATH:$JAVA_HOME/bin

#HADOOP_HOME

export HADOOP_HOME=/opt/module/hadoop-3.1.3

export PATH=$PATH:$HADOOP_HOME/bin

export PATH=$PATH:$HADOOP_HOME/sbin

?

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-09-12 13:14:07  更:2021-09-12 13:16:21 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/18 13:51:45-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码