| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> Hadoop -> 正文阅读 |
|
[大数据]Hadoop |
??之前听过hadoop,用过hadoop,发现还没有系统的了解一下。借着这篇文章来讲一下吧~ 一、什么是hadoop???Hadoop是存储海量数据和分析海量数据的工具,整体是分布式结构,不需要计算存储一体的大型计算机 多个小型计算机之间通过相互通信协同完成任务。同时hadoop也是一个分布式系统基础架构和对大量数据进行分布式处理的软件框架,可以让用户开发和运行处理海量数据的应用程序。hadoop的logo如下图,是一只可爱的小象: ??Hadoop有如下的三大优势: ??有一个问题了:hadoop的三大优势是如何体现的呢?这就与Hadoop的三大组成结构有关了。 二、Hadoop的组成结构??Hadoop总共有三大组成结构:HDFS、MapReduce、Yarn(好像还有个Common,但是不是很重要,就总结为三大结构啦~)。下面来介绍下这三大结构吧: 1.HDFS(Hadoop Distributed File System):??HDFS即分布式文件系统,是分布式文件管理系统的其中一种,主要解决大量数据的存储问题。它将文件拆分,并提供文件通过网络在多台主机上分享的功能。用多台主机存储数据,解决了大量数据的存储问题。 ??HDFS中数据以block为基本单位存储,block的大小为128MB,但具体还是取决于磁盘传输效率 ??HDFS主要由三部分组成: ?Namenode是存储控制、Datanode存放具体的文件。一个namenode会有很多个datanode。HDFS具体的存储流程是客户端、namenode、datanode之间的数据流动。 参考:https://blog.csdn.net/weixin_28707609/article/details/118585137 2.MapReduce??MapReduce是计算框架,会解决大量数据的计算问题,因为在不同主机。MapReduce的计算实际上是并行计算。适合并行计算就要求各节点数据尽量相互独立。 参考:https://blog.csdn.net/burpee/article/details/78769161 ??对于mapreduce的详细工作流程可以看看:https://www.bilibili.com/video/BV12h411t7jB?p=2&spm_id_from=pageDriver&vd_source=7b9f1ca2783a4c39a4d640a31e23457e 3.Yarn??Yarn是资源调度平台,为运算程序提供资源管理。这里的资源大多指硬件资源了,有了Yarn可以让HDFS和mapredeuce更好的工作 ??Yarn主要有如下四部分构成: ??2)节点管理器:处理并监控节点中的资源使用情况,管理单个节点上的资源。处理来自资源管理器和应用管理器的命令 ??3)应用管理器:管理当前整体各种应用,为应用程序申请内部资源 ??4)容器:所有物理资源的集合 参考:https://blog.csdn.net/sileiH/article/details/117962890 三、学习hadoop的重点??hadoop的东西还是比较庞大的,从实践和原理两个角度出发谈谈学习的重点吧: 学习资料: 因作者水平有限,如果错误之处,请在下方评论区指出,谢谢! |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/16 1:37:42- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |