IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 谈谈大数据架构下的存储系统 -> 正文阅读

[大数据]谈谈大数据架构下的存储系统

相信了解过大数据的小伙伴们,对大数据架构的各个组件的名称和大致作用肯定有一定的了解。那我们来看看那些属于存储系统吧1.hadoop,毫无疑问,它肯定是存储系统,用来存储分布式文件的。从存取速度角度来说,它的速度并不快。从数据量来说,海亮数据存储说的就是以它为鼻祖的组件。他并不擅长存取大量的小文件。适合存储大文件。因为文件的元数据信息保存在namenode的内存中,这个数据结构决定了不能存储太多小文件。
2.hive,它不是存储系统,它是一个基于hadoop的数据仓库,即可以讲存储在hadoop上的结构化文件的内容转化为数据库的逻辑结构。没有了hadoop,hive将无法运行。
3.hbase,他是一个存储系统,不基于hadoop运行,它有自己的文件存储实现。适合来做大量数据的随机读。它需要借助于zookeeper来提供集群管理。
4.kafka,它是一个就是的消息中间件,是一个存储系统。它将发送到它的消息以顺序的形式写入文件,故可以提供快速的磁盘读。它不能存储文件,而是存储消息。
5.zookeeper,它是一个分布式协调服务,它的内部可以存储数据,但不存储文件。而且设计的原理就是为了分布式协调而来,故对文件化存储不支持,也不要用它来做这个。
6.spark,flink等计算框架,这些计算框架里不支持数据存储,它们是做为调用存储系统中的数据,计算后写入存储的一个系统。
7.其他数据库组件,其他关于数据库的组件,基本都是有自己数据存储的模块实现,如es,CK,doris,kudu等。这里就不做一一介绍了。
当然了,也还有其他组件,去数据湖组件,我这边基本没有接触过。有兴趣的小伙伴可以留言。我这里会做相应的分享。

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-01-01 13:58:47  更:2022-01-01 13:59:29 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 13:47:37-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码