| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> Hadoop集群搭建(安装JDK,Hadoop) -> 正文阅读 |
|
[大数据]Hadoop集群搭建(安装JDK,Hadoop) |
??一、准备1.准备一台模板虚拟机hadoop100,便于后面虚拟机的克隆 安装模板虚拟机,IP地址192.168.10.100、主机名称hadoop100、内存4G、硬盘50G 参考:https://download.csdn.net/download/llx_2000/21481228 2.配置要求 1.2.1使用yum安装需要虚拟机可以正常上网,yum安装前可以先测试下虚拟机联网情况
1.2.2安装epel-release 注:Extra Packages for Enterprise Linux是为“红帽系”的操作系统提供额外的软件包,适用于RHEL、CentOS和Scientific Linux。相当于是一个软件仓库,大多数rpm包在官方 repository 中是找不到的)
1.2.3注意:如果Linux安装的是最小系统版,还需要安装如下工具;如果安装的是Linux桌面标准版,不需要执行如下操作
?3.关闭防火墙及自启动
4.创建用户,修改密码
?5.配置llx用户具有root权限,方便后期加sudo执行root权限的命令
?修改/etc/sudoers文件,在%wheel这行下面添加一行,如下所示
注意:llx这一行不要直接放到root行下面,因为所有用户都属于wheel组,你先配置了llx具有免密功能,但是程序执行到%wheel行时,该功能又被覆盖回需要密码。所以llx要放到%wheel这行下面。? 6.在/opt目录下创建文件夹,并修改所属主和所属组 1.6.1在/opt目录下创建module、software文件夹
?1.6.2修改module、software文件夹的所有者和所属组均为llx用户
1.6.3查看module、software文件夹的所有者和所属组
7.?卸载虚拟机自带的JDK ?注意:如果你的虚拟机是最小化安装不需要执行这一步。
8.重启虚拟机
二、克隆虚拟机?1.利用模板机hadoop100,克隆三台虚拟机:hadoop102 hadoop103 hadoop104 注意:克隆时,要先关闭hadoop100 2.修改克隆机IP,以下以hadoop102举例说明 2.1修改克隆虚拟机的静态IP
改成
2.1查看Linux虚拟机的虚拟网络编辑器,编辑->虚拟网络编辑器->VMnet8 2.3查看Windows系统适配器VMware Network Adapter VMnet8的IP地址 2.4保证Linux系统ifcfg-ens33文件中IP地址、虚拟网络编辑器地址和Windows系统VM8网络IP地址相同。 3.修改克隆机主机名,以下以hadoop102举例说明 3.1修改主机名称
3.2配置Linux克隆机主机名称映射hosts文件,打开/etc/hosts
添加如下内容
4.重启克隆机hadoop102
5.修改windows的主机映射文件(hosts文件) 5.1如果操作系统是window7,可以直接修改 ?????? (a)进入C:\Windows\System32\drivers\etc路径 ?????? (b)打开hosts文件并添加如下内容,然后保存
5.2如果操作系统是window10,先拷贝出来,修改保存以后,再覆盖即可 (a)进入C:\Windows\System32\drivers\etc路径 (b)拷贝hosts文件到桌面 (c)打开桌面hosts文件并添加如下内容
(d)将桌面hosts文件覆盖C:\Windows\System32\drivers\etc路径hosts文件 ?三、安装JDK1.卸载现有JDK 注意:安装JDK前,一定确保提前删除了虚拟机自带的JDK。 2)用XShell传输工具将JDK导入到opt目录下面的software文件夹下面 3.在Linux系统下的opt目录中查看软件包是否导入成功
看到如下结果:
4.解压JDK到/opt/module目录下
5.配置JDK环境变量 5.1新建/etc/profile.d/my_env.sh文件
添加如下内容
5.2保存后退出 :wq 5.3 source一下/etc/profile文件,让新的环境变量PATH生效
6.测试JDK是否安装成功
如果能看到以下结果,则代表Java安装成功。
注意:重启(如果java -version可以用就不用重启)
三、安装HadoopHadoop下载地址:https://archive.apache.org/dist/hadoop/common/hadoop-3.1.3/ 1.用XShell文件传输工具将hadoop-3.1.3.tar.gz导入到opt目录下面的software文件夹下面 2.进入到Hadoop安装包路径下
3.解压安装文件到/opt/module下面
4.查看是否解压成功
5.将Hadoop添加到环境变量 5.1获取Hadoop安装路径
5.2打开/etc/profile.d/my_env.sh文件
5.3让修改后的文件生效 [llx@hadoop102 hadoop-3.1.3]$ source /etc/profile 6.测试是否安装成功
7.重启(如果Hadoop命令不能用再重启虚拟机)
四、Hadoop目录结构1.查看Hadoop目录结构
2.重要目录 (1)bin目录:存放对Hadoop相关服务(hdfs,yarn,mapred)进行操作的脚本 (2)etc目录:Hadoop的配置文件目录,存放Hadoop的配置文件 (3)lib目录:存放Hadoop的本地库(对数据进行压缩解压缩功能) (4)sbin目录:存放启动或停止Hadoop相关服务的脚本 (5)share目录:存放Hadoop的依赖jar包、文档、和官方案例 五、Hadoop运行模式1.Hadoop官方网站:http://hadoop.apache.org/ 2.Hadoop运行模式包括:本地模式、伪分布式模式以及完全分布式模式。
5.1本地运行模式(官方WordCount)5.1.1创建在hadoop-3.1.3文件下面创建一个wcinput文件夹
5.1.2在wcinput文件下创建一个word.txt文件
5.1.3编辑word.txt文件
5.1.4回到Hadoop目录/opt/module/hadoop-3.1.3 5.1.5执行程序 5.1.6查看结果
看到如下结果:
5.2 完全分布式运行模式分析: ?????? 1)准备3台客户机(关闭防火墙、静态IP、主机名称) ?????? 2)安装JDK ?????? 3)配置环境变量 ?????? 4)安装Hadoop ?????? 5)配置环境变量 ?????? 6)配置集群 ???????7)单点启动 ?????? 8)配置ssh ?????? 9)群起并测试集群?? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/23 13:18:51- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |