| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> hadoop分布式集群搭建 -> 正文阅读 |
|
[大数据]hadoop分布式集群搭建 |
Hadoop入门1. 了解Hadoop1.1 Hadoop 的优势(4高)高可靠性:存在多个数据副本,即使某个元素或存储出现故障,也不会导致数据的丢失 高拓展性:在集群见分配任务数据,可方便的拓展数以千计的节点 高效性:Hadoop是并行工作的,以加快任务的处理速度 高容错性:能够自动将失败的任务重新分配 1.2 Hadoop的组成在Hadoop1.x时代,Hadoop中的MapReduce同时处理业务逻辑和资源的调度,耦合度比较大 在Hadoop2.x时代,Hadoop增加了Yarn,Yarn只负责资源的调度,MapReduce只负责运算。 Hadoop3.x时代在组成上没有发生变化。 1.3HDFS架构什么是HDFS?HDFS是Hadoop DIstributed File System 的简称,是一个分布式文件系统 HDFS简述NameNode(nn):存储文件中的元数据,如文件名、文件目录结构、文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等 DateNode (dn)在本地文件系统存储文件块数据,以及块数据的校验和 Secondary NameNode(2nn)每隔一段时间对Name Node原数据进行备份 YARN概述Yet Another Resource Negotiator简称YARN,是资源协调者,是Hadoop的资源管理器 ResourceManager(RM)整个集群资源(CPU、内存等)的老大 NodeManager(NM)单个节点服务器资源的老大 ApplicationMaster(AM)单个任务运行的老大 Container容器,相当于一台独立的服务器,里面封装了任务运行所需要的资源,如内存、CPU、磁盘、网络等
MapReduceMapReduce将运算过程分为两个阶段
HDFS YARN MapReduce三者之间的关系大数据技术生态体系框架图:Hadoop集群环境的安装集群角色的规划规划准则根据软件工作特性和服务器硬件资源情况合理分配 角色规划注意事项资源上有争抢夺冲突的,尽量不要部署在一起。 工作上需要相互配合的,尽量部署在一起。 安装JDK由于是最小安装,所以不在带openJDK,只能自己安装。 将jdk拖入到服务器进行解压,随后配置环境变量如下: 随后输入使得文件重新加载。
输入Javac 查看是否安装成功 显然安装成功。 安装Hadoop下载Hadoop 然后进行解压,这里是解压到了opt/module下,解压后进入到其路径下,获取路径 随后配置环境变量: 重新加载,随后进行检查:
运行结果如下: 显然已经安装成功。若搭配集群,操作方法相同。 配置免密登录配置免密登录需要安装ssh,这里由于是提前安装好的,就不再进行安装。由于我实在root用户下进行操作的,所以某些操作可能不同 进入到 生成公钥、私钥: 在这个过程中需要连点三个回车。随后需要将公钥交给免密登录的目标机器上,由于是集群,这里一共有四个hadoop132 ~ hadoop-135,其中将hadoop132作为父节点,加上了-father 即hadoop132-father 开始进行拷贝。
集群的角色划分
配置文件配置文件主要在hadoop目录下的etc/hadoop/文件下 配置hadoop-env.sh文件路径在 HADOOP_HOME下的etc/hadoop 配置文件如下:
配置core-site.xmlcore-site.xml是hadoop的核心配置文件,但是这是可以进行自定义的,默认配置文件为core-default.xml. core-default.xml喝core-site.xml的功能是一样的,如果在core-site.xml中没有配置属性,那么就会自动获取core-default.xml文件中的相同属性的值 我们编写配置文件
配置hdfs-site.xml文件HDFS的核心配置文件,主要配置HDFS的相关参数,默认配置选项为hdfs-default.xml 配置如下:
修改mapred-site.xmlMapReduce的核心配置文件 配置如下:
修改YARN核心配置文件核心文件为:
修改workersworkers主要记录的集群的主机名,一半有以下两个作用:
配置如下:
同步配置采用的是
NameNode format(格式化)操作本质上时进行一个初始化。首次启动HDFS是必须进行此操作 format本质上是初始化工作,进行HDFS清理和准备工作 命令: 注意:
如果出现了这个就表示格式化成功,或者说初始化成功 启动集群Hadoop 集群存在两种启动方式:
手动单个启动
HDFS集群
YARN集群
案例: 一键操作可以通过hadoop提供的shell脚本进行一键启动关闭 前提 配置好了免密登录和workers文件 HDFS集群:
YARN集群
直接启动hadoop集群
启动测试father节点:hadoop133节点hadoop134节点:访问UI页面:HDFS UI页面
页面如下: YARN UI页面:
页面如下: 测试是否成功:上传文件进行尝试: 将这个hadoop的压缩包进行一个上传 上传指令:
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/23 5:47:12- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |