[大数据] Hadoop 服务组件

IT数码购物网址头条软件日历阅读图书馆

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放器↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> Hadoop 服务组件 -> 正文阅读

[大数据]Hadoop 服务组件

HDFS

NameNode 负责保存HDFS的元数据信息，比如命名空间信息，块信息
~~Secondary NameNode~~ 是 NameNode的一个助手节点，是一个检查点，负责合并NameNode的edit logs到fsimage文件中
JournalNode 负责 HA 中 active namenode 与standby namenode 数据的实时同步（QJM 3节点JN,zookeeper故障转移）
DataNode 负责namenode的调度存储和检索数据，并且定期向namenode发送他们所存储的块(block)的列表
HttpFS http协议访问hdfs文件系统
ZKFailoverController 基于zookeeper 负责对NameNode进行监控，健康监测和主备切换故障转移
HDFSClient

YARN

ResourceManager 是集群的资源管理器，基于应用程序对资源的需求进行调度。资源管理器提供一个调度策略的插件，它负责将集群资源分配给多个队列和应用程序。调度插件可以基于现有的能力调度和公平调度模型
NodeManager YARN 集群中的每个具体节点的管理者,负责本身节点程序的运行，以及该节点资源的管理和监控
HistoryServer Hadoop 1.x遗留下的产物，是专门用于展示MR作业的
TimelineServer 检索YARN中当前运行的、以及历史运行的作业
Container 当用户提交个任务时，YARN 会启动一个轻量级的进程 ApplicationMaster 来协调 ResourceManager 的资源并基于（如内存、CPU、磁盘、网络）封装成个 Container，
YARNClient

Hive

HiveServer2 允许远程客户端可以使用各种编程语言向 Hive 提交请求并检索结果，支持多客户端并发访问和身份验证
MetaStore Hive 进行的是统一的元数据管理，就是说你在 Hive 上创建了一张表，然后在 presto／impala／sparksql 中都是可以直接使用的
HiveClient

Spark

SparkThriftServer Spark Thrift Server是Spark社区基于HiveServer2实现的一个Thrift服务。旨在无缝兼容HiveServer2,可以直接使用hive的beeline访问Spark Thrift Server执行相关语句
SparkHistoryServer 是Spark 应用程序的 Web UI ,展示Spark 应用程序的作业、阶段、任务、执行器的环境详细信息
SparkClient

HBase

HMaster 是HBase 集群中的主服务器
HRegionServer 是存储实际Region，响应客户端写入的IO，并负责存储数据到HDFS中
HThriftServer Thrift server是HBase中的一种服务，主要用于对多语言API的支持
HBaseClient

DolphinScheduler

DolphinSchedulerApi API接口层，主要负责处理前端UI层的请求。该服务统一提供RESTful api向外部提供请求服务。接口包括工作流的创建、定义、查询、修改、发布、下线、手工启动、停止、暂停、恢复、从该节点开始执行等等。
DolphinSchedulerMaster MasterServer主要负责 DAG 任务切分、任务提交监控，并同时监听其它MasterServer和WorkerServer的健康状态
DolphinSchedulerWorker 主要负责任务的执行和提供日志服务。 WorkerServer服务启动时向Zookeeper注册临时节点，并维持心跳。
DolphinSchedulerAlert 提供告警相关功能

通用

Tez Tez是从MapReduce计算框架演化而来的通用DAG计算框架,可以用来替换 hive 产生的MapReduce作业
Hive On Spark 把hive执行引擎换成spark ，将Hive的查询作为Spark的任务提交到Spark集群上进行计算

大数据最新文章

实现Kafka至少消费一次

亚马逊云科技：还在苦于ETL？Zero ETL的时代

初探MapReduce

【SpringBoot框架篇】32.基于注解+redis实现

Elasticsearch：如何减少 Elasticsearch 集

专题五 Redis高并发场景

基于GBase8s和Calcite的多数据源查询

Redis——底层数据结构原理

上一篇文章下一篇文章查看所有文章

加:2022-09-30 00:59:31 更:2022-09-30 01:03:22

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

360图书馆购物三丰科技阅读网日历万年历 2025年12日历

-2025/12/2 7:05:28-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码