IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 大数据框架 -> 正文阅读

[大数据]大数据框架

大数据是指通常每天都在不断增长的庞大数据集。 例如,Facebook 的用户数量每天都在不断增长,每个用户的数据也随着他们浏览 Facebook 的增长而增长。

此类数据可以是结构化的,也可以是非结构化的。 数据很大,因此在复杂性和速度上也更大,即它既快速又复杂。 因此,大数据由 3V 标识,即体积、多样性和速度。

?

大数据帮助我们分析数据并对其进行各种操作,以优化成本和时间。 当我们将这些大数据与强大的框架结合使用时,就可以更轻松地实时找到确切的(解决方案)问题或问题。

For English translation blog -?Big Data Frameworks

顶级大数据框架

1. Hadoop

Hadoop是一个基于Java的开源大数据框架,提供批处理和数据存储服务。 它有一个巨大的架构,由许多层组成,如用于数据处理的 HDFS 和 YARN。

2.?Apache Spark

Spark 是一个批处理框架,具有增强的数据流处理。 它促进了内存计算,使同样的超快。 大数据框架与 Hadoop 集成,可以作为独立的集群工具。

3.?MapReduce

MapReduce 是一个大数据搜索引擎,是 Hadoop 框架的一部分。 最初,它只是一种并行处理大量数据的算法。 现在,它不仅如此,还分 3 个阶段工作:

  • Map
  • Shuffle
  • Reduce

4.?Apache Hive

Facebook 将 Apache Hive 设计为 ETL 和数据仓库工具。 它建立在 Hadoop 生态系统的 HDFS 平台之上。 Hive 由 3 个组件组成,即客户端、服务和存储以及计算。

Apache Hive 有其用于查询的声明性语言,即 HiveQL,它非常适合数据密集型作业。 JP Morgan、Facebook、Accenture 和 PayPal 等公司都使用 Hive。

5.?Flink

Flink 基于 Kappa 架构,是一个开源的单流处理引擎。 它有一个处理器将输入视为流,流引擎实时处理数据。 批处理是流式处理的一个特例。

6.?Samza

通过 Samza,您可以构建可处理来自各种来源的实时数据的有状态应用程序。 它旨在解决批处理延迟(大周转时间)问题。

7.?Storm

Storm 处理巨大的实时数据流。 它旨在处理低延迟并且具有高度可扩展性。 Storm 可以在停机后更快地恢复。 它是 Twitter 的第一个大数据框架,之后也被雅虎、Yelp 和阿里巴巴等巨头采用。

8.?Impala

在 C++ 和 Java 中,Impala 是一个开源的大规模并行处理查询引擎,可以在单个 Hadoop 集群中处理海量数据。

就像 Hive 有自己的查询语言一样,Impala 也有! 它具有低延迟和高性能,并且在性能和可用性方面提供了接近 RDBMS 的体验。 Impala 就像两全其美:SQL 等查询语言的性能和支持以及 Hadoop 的灵活性和可扩展性。

结论

这完成了我们的 10 个最佳大数据框架列表。 但是,还有许多其他值得一提的大数据框架我们没有在本文中介绍,但需要提及:

  • 苍鹭,
  • 苦杜,
  • 打开精炼,
  • 卡格尔,
  • Cloudera 和
  • 五角星
  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-12-02 16:50:07  更:2021-12-02 16:51:40 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 8:37:15-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码