IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Hadoop 服务 组件 -> 正文阅读

[大数据]Hadoop 服务 组件

HDFS

  1. NameNode 负责保存HDFS的元数据信息,比如命名空间信息,块信息
  2. Secondary NameNode 是 NameNode的一个助手节点,是一个检查点,负责合并NameNode的edit logs到fsimage文件中
  3. JournalNode 负责 HA 中 active namenode 与standby namenode 数据的实时同步 (QJM 3节点JN,zookeeper故障转移)
  4. DataNode 负责namenode的调度存储和检索数据,并且定期向namenode发送他们所存储的块(block)的列表
  5. HttpFS http协议访问hdfs文件系统
  6. ZKFailoverController 基于zookeeper 负责对NameNode进行监控,健康监测和主备切换 故障转移
  7. HDFSClient

YARN

  1. ResourceManager 是集群的资源管理器,基于应用程序对资源的需求进行调度。资源管理器提供一个调度策略的插件,它负责将集群资源分配给多个队列和应用程序。调度插件可以基于现有的能力调度和公平调度模型
  2. NodeManager YARN 集群中的每个具体节点的管理者,负责本身节点程序的运行,以及该节点资源的管理和监控
  3. HistoryServer Hadoop 1.x遗留下的产物,是专门用于展示MR作业的
  4. TimelineServer 检索YARN中当前运行的、以及历史运行的作业
  5. Container 当用户提交个任务时,YARN 会启动一个轻量级的进程 ApplicationMaster 来协调 ResourceManager 的资源 并基于(如内存、CPU、磁盘、网络)封装成个 Container,
  6. YARNClient

Hive

  1. HiveServer2 允许远程客户端可以使用各种编程语言向 Hive 提交请求并检索结果,支持多客户端并发访问和身份验证
  2. MetaStore Hive 进行的是统一的元数据管理,就是说你在 Hive 上创建了一张表,然后在 presto/impala/sparksql 中都是可以直接使用的
  3. HiveClient

Spark

  1. SparkThriftServer Spark Thrift Server是Spark社区基于HiveServer2实现的一个Thrift服务。旨在无缝兼容HiveServer2,可以直接使用hive的beeline访问Spark Thrift Server执行相关语句
  2. SparkHistoryServer 是Spark 应用程序的 Web UI ,展示Spark 应用程序的作业、阶段、任务、执行器的环境详细信息
  3. SparkClient

HBase

  1. HMaster 是HBase 集群中的主服务器
  2. HRegionServer 是存储实际Region,响应客户端写入的IO,并负责存储数据到HDFS中
  3. HThriftServer Thrift server是HBase中的一种服务,主要用于对多语言API的支持
  4. HBaseClient

DolphinScheduler

  1. DolphinSchedulerApi API接口层,主要负责处理前端UI层的请求。该服务统一提供RESTful api向外部提供请求服务。 接口包括工作流的创建、定义、查询、修改、发布、下线、手工启动、停止、暂停、恢复、从该节点开始执行等等。
  2. DolphinSchedulerMaster MasterServer主要负责 DAG 任务切分、任务提交监控,并同时监听其它MasterServer和WorkerServer的健康状态
  3. DolphinSchedulerWorker 主要负责任务的执行和提供日志服务。 WorkerServer服务启动时向Zookeeper注册临时节点,并维持心跳。
  4. DolphinSchedulerAlert 提供告警相关功能

通用

  1. Tez Tez是从MapReduce计算框架演化而来的通用DAG计算框架,可以用来替换 hive 产生的MapReduce作业
  2. Hive On Spark 把hive执行引擎换成spark ,将Hive的查询作为Spark的任务提交到Spark集群上进行计算
  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-09-30 00:59:31  更:2022-09-30 01:03:22 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 5:27:24-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码