IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 学习笔记之Hadoop -> 正文阅读

[大数据]学习笔记之Hadoop

作为一个大数据人,从没有系统的学习过Hadoop,这可还行?!最近开始整理一些大数据相关基础知识,及时整理汇总,自我督促。

大数据部门常见组织架构

大公司完整的组织架构一般需要有四部分:

  • 平台组

    Hadoop、Flume、Kafka、HBase框架平台的搭建

    集群性能的监控

    集群性能的调优

  • 数据仓库组

    ETL工程师——数据清洗

    Hive工程师——数据分析、数仓建模

  • 数据挖掘组

    算法工程师

    推荐系统工程师

    用户画像工程师

  • 报表开发组

    JavaEEI工程师

对Hadoop的一点理解

  • 分布式系统基础架构
  • 海量数据的存储与分析
  • 广义来说Hadoop是个生态圈

Hadoop的优势

  • 高可靠性:多个副本
  • 高扩展性:扩展节点
  • 高效性:可并行工作
  • 高容错性:自动将失败的任务重新分配

对比Hadoop1.X和Hadoop2.X

现在主流的是2.X,简而言之,2.X实现了解耦,把资源调度拆分出来,不止可以调度MapReduce的资源,还可以调度其它机算框架的资源,比如Spark、Flink等。

Hadoop1.X

MapReduce:计算+资源调度

HDFS:数据存储

Common:辅助工具

Hadoop2.X

MapReduce:计算

Yarn:资源调度

HDFS:数据存储

Common:辅助工具

从架构角度谈一谈Hadoop

HDFS架构

DataNode(dn):有多个,存数据本体,可以理解为移动硬盘们

NameNode(nn):有一个,存元数据,可以理解为目录、索引

Secondary NameNode(2nn):不是nn的备份,如果nn挂了,2nn可以帮nn恢复一些,但有缺陷

Yarn架构

调度的是内存和CPU,管理的是工作时长

Resource Manager(RM):处理客户端请求、监控NM、启动或者监控ApplicationMaster(相当于临时负责人)

Node Manager(NM):管理单个节点上的资源、处理RM的命令、处理AM的命令

Application Manager(AM):数据切分、为应用程序申请资源并分配给内部任务

Container:Yarn的资源抽象

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-20 15:11:21  更:2021-08-20 15:11:56 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 13:04:52-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码