| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> hadoop集群的安装(最详细的安装教程) -> 正文阅读 |
|
[大数据]hadoop集群的安装(最详细的安装教程) |
版本:3.1.3 1.准备工作: 更新和安装组件 ?? ??? ?? ? 1. yum install -y epel-release ?? ??? ?? ? 2. yum install -y net-tools ?? ??? ?? ? 3. yum install -y vim ? ? 防火墙的关闭和禁止开启自动启动 ?? ??? ?? ? 1. systemctl stop firewalld ?? ??? ?? ? 2.? systemctl disable firewalld.service 创建 sea?用户,并修改 sea?用户的密码:(***为自己的用户名) 给用户赋予root权限 ?? ??? ?? ? 1.配置文件??/etc/sudoers ?? ??? ??? ??? ??? ??在%wheel 这行下面添加一行
seaALL=(ALL) NOPASSWD:ALL
sea为用户名
在/opt 目录下创建文件夹,并修改所属主和所属组?
mkdir /opt/module?? ??? ?? ? //用于存放安装的软件
mkdir /opt/software?? ?? ? ?? ?///装一些下载的文件
修改 module、software 文件夹的所有者和所属组均为 sea用户
主机IP静态配置 ?? ??? ??? ??配置文件:vim /etc/sysconfig/network-scripts/ifcfg ens33 ?? ??? ??? ?
? ? 主机名称的配置 ?? ??? ?? ? 配置文件 vim /etc/hostname ?? ?配置 Linux 克隆机主机名称映射 hosts 文件 ?? ??? ??? ? vim /etc/hosts ?? ??? ?? ? ?格式为:
同步xsync的配置和安装 在/home/sea/bin 目录下创建 xsync 文件 ?? ??? ??? ? vim xsync
修改脚本 xsync 具有执行权限
chmod +x xsync
? 将脚本复制到/bin 中,以便全局调用
sudo cp xsync /bin/
同步环境变量配置(root 所有者)
sudo ./bin/xsync /etc/profile.d/my_env.sh
让环境变量生效
source /etc/profile
设置密码登录
1.进入目录 /home/sea/.ssh ? ? 运行 ssh-keygen -t rsa 将公钥拷贝到要免密登录的目标机器上包括自己 ssh-copy-id 主机名 jdk的安装: tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/module/ 环境变量配置 在/etc/profile.d创建一个 my_env.sh用于配置环境变量 vim?my_env.sh 配置文件: vim /etc/profile.d/my_env.sh
生效:source /etc/profile 2.安装hadoop的安装 优化配置,将消耗资源较大的分在不同的机子上 ?
解压:
tar -zxvf hadoop-3.1.3.tar.gz -C /opt/module/
环境变量的配置: sudo vim /etc/profile.d/my_env.sh
文件配置 1. core-site.xml
(2)HDFS 配置文件? 配置hdfs-site.xml
(3)YARN 配置文件 ?配置 yarn-site.xml
(4)MapReduce 配置文件? 配置 mapred-site.xml
(5) workers文件,这里面是自己集群的主机名
即在里面添加集群的机子的主机名称或地址,而且地址后面不能有空格和空行 配置完成后记得分发到其他的机子上 xsync + 文件名? ? ? ? (xsync 是上边自己写的一个分发脚本)
(6)初始化
hdfs namenode -format
初始化时注意事项:
如果集群是第一次启动,需要在 hadoop102 节点格式化 NameNode(注意:格式 化 NameNode,会产生新的集群 id,导致 NameNode 和 DataNode 的集群 id 不一致,集群找 不到已往数据。如果集群在运行过程中报错,需要重新格式化 NameNode 的话,一定要先停 止 namenode 和 datanode 进程,并且要删除所有机器的 data 和 logs 目录,然后再进行格式 化
初始化成功后为有两个文件 data 和logs? ? 就是在上面配置时定义的文件、 在/opt/module/hadoop-3.1.3/data/dfs/name/current中为出现如下文件 ? ?开打VERSION有id、版本号等 ?
启动dfs
sbin/start-dfs.sh
在hadoop101上出现的进程为
在hadoop102上出现的进程为 ? 在hadoop103上出现的进程为 ? 如果hadoop101上没有NameNode优先检查 core-site.xml是否配置错误 NameNode没有出现的解决办法为: https://blog.csdn.net/zhaogang1993/article/details/92727952 ? ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/23 5:35:52- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |