hadoop基础配置及伪分布实现
目录
一、基础环境准备
-
操作系统准备
-
换源
-
安装java
-
安装其他软件
-
安装ssh
-
sudo apt-get install ssh
-
生成ssh密钥 ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
获取本机ssh访问权限 ssh-copy-id localhost
按下回车后会有确认是否加入hostList的询问,输入 “yes” 再按回车 然后需要你输入本机密码 -
测试ssh访问 ssh localhost
安装rsync -
sudo apt-get install rsync
二、单机hadoop安装与配置
-
hadoop的安装
-
hadoop配置 – 单机伪分布式 首先先说一点,这里的配置,往往一空格,一个标点符号或者大小写的错误都会导致最终运行失败,所以输入之前一定要检查!!
-
core-site.xml
-
hdfs-site.xml
三、Hadoop的运行
-
启动hadoop和运行任务
-
格式化NameNode并启动
-
格式化 ~/hadoop-3.2.2/bin/hdfs namenode -format
-
启动NameNode ~/hadoop-3.2.2/sbin/start-dfs.sh
-
查看集群状态 hadoop@ubuntu:~$ jps
10960 NameNode
11529 Jps
11115 DataNode
11372 SecondaryNameNode
-
浏览NameNode的web接口 直接在虚拟机的浏览器里打开 http://localhost:9870 -
执行一些hdfs操作(之后会经常用到,熟记) hdfs是一个文件系统,操作和电脑的文件浏览器差不多,有创建文件夹、移动文件等操作
-
创建hdfs目录 ~/hadoop-3.2.2/bin/hdfs dfs -mkdir /user
~/hadoop-3.2.2/bin/hdfs dfs -mkdir /user/input
-
拷贝输入文件到hdfs上 ~/hadoop-3.2.2/bin/hdfs dfs -put ~/hadoop-3.2.2/etc/hadoop/*.xml /user/input
这个操作是将-put后面的 etc/hadoop/目录下所有后缀为xml的文件复制到hdfs文件系统的/user/hadoop目录下 -
查看一下hdfs的文件 hadoop@ubuntu:~$ ~/hadoop-3.2.2/bin/hdfs dfs -ls /user/input
Found 9 items
-rw-r--r-- 1 hadoop supergroup 9213 2021-10-26 06:54 /user/hadoop/capacity-scheduler.xml
-rw-r--r-- 1 hadoop supergroup 867 2021-10-26 06:54 /user/hadoop/core-site.xml
-rw-r--r-- 1 hadoop supergroup 11392 2021-10-26 06:54 /user/hadoop/hadoop-policy.xml
-rw-r--r-- 1 hadoop supergroup 849 2021-10-26 06:54 /user/hadoop/hdfs-site.xml
-rw-r--r-- 1 hadoop supergroup 620 2021-10-26 06:54 /user/hadoop/httpfs-site.xml
-rw-r--r-- 1 hadoop supergroup 3518 2021-10-26 06:54 /user/hadoop/kms-acls.xml
-rw-r--r-- 1 hadoop supergroup 682 2021-10-26 06:54 /user/hadoop/kms-site.xml
-rw-r--r-- 1 hadoop supergroup 758 2021-10-26 06:54 /user/hadoop/mapred-site.xml
-rw-r--r-- 1 hadoop supergroup 690 2021-10-26 06:54 /user/hadoop/yarn-site.xml
-
运行MapReduce
-
最后关闭hadoop集群,修改配置之前要先关闭集群 ~/hadoop-3.2.3/sbin/stop-dfs.sh
|