IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 分布式文件存储HDFS学习(一) -> 正文阅读

[大数据]分布式文件存储HDFS学习(一)

分布式文件系统

单机与分布式存储区别

单机存储
存储块:512KB
单个计算机节点
硬件要求高
分布式存储
存储块:64MB
但是一个文件小于数据块的大小,并不占用整个数据块
多个节点构成
硬件要求低

分布式文件系统结构:什么是节点

节点分为两类(后面会详细说明):
1.主节点(名称节点)
负责目录的创建、删除和重命名等,同时管理着数据节点和文件块的映射关系
2.从节点(数据节点)
负责数据的存储和读取,在存储时,由名称节点分配存储位置,再由客户端把数据直接写入相应的数据节点,数据节点也要更具名称节点命令创建,删除数据块,冗余复制。

注意:下图的客户端可以是同一个客户端,分开是为了更好的区分流程
大规模文件系统的整体结构

节点放到机架上,同一机架上的不同节点之间通过网络互连,不同机架之间通过另一级别的网络或交换机互连。
在这里插入图片描述
在这里插入图片描述

分布式文件系统的设计需求

设计目标:透明性并发控制性文件复制硬件和操作系统的异构性可伸缩性容错安全
在这里插入图片描述

HDFS简介

HDFS和MapReduce一起成为Hadoop的核心组成部分。支持流数据读取和处理超大规模文件,并能够运行在有廉价的普通机器组成的集群上。

HDFS实现目标:
1.兼容廉价的硬件设备
2.流数据读写
3.大数据集
4.简单文件模型
5.强大的跨平台兼容性
6.不适合低延迟数据访问
7.无法高效存储大量小文件

HDFS的相关概念

一般的文件系统都是以数据块为单位,这样能提高数据的读写效率
ps:硬盘在寻道的时候以块寻道肯定比字节寻道块

HDFS一般采用64mb为一个数据块,因为HDFS存储的一般是超大文件

好处:
1.支持大规模文件存储
2.简化系统设计
3.适合数据备份

名称节点和数据节点

在HDFS中,名称节点(NameNode)负责管理分布式文件系统的命名空间(Namespace)。保存了两个核心的数据结构,即FsImageEditLog

??????FsImage用于维护文件系统树以及文件树所有的文件和文件夹的元数据,操作日志文件EditLog中记录了所有针对文件的创建、删除、重命名等操作。

??????名称节点记录了每个文件中各个块所在的数据节点的位置信息,但是并不持久化存储这些信息,而是在系统每次启动时扫描所有数据节点重构得到这些信息。

在这里插入图片描述

数据节点(DataNode)是分布式文件系统HDFS的工作节点,负责数据的存储和读取,会根据客户端或者名称节点的调度来进行数据的存储和检索,并且向名称节点定期发送自己所存储的块的列表。每个数据节点中的数据会被保存在各自节点的本地Linux文件系统中。

第二名称节点

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-09-24 21:03:44  更:2022-09-24 21:04:09 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 9:34:34-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码