IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 大数据平台各种工具和名词解惑 -> 正文阅读

[大数据]大数据平台各种工具和名词解惑

什么是ETL?

什么是ETL?为什么需要ETL?

通俗易懂型:互联网业务实战(三)--ETL和推荐_firsthealth的博客-CSDN博客

全面详细型:ETL的基础知识,看完你就全明白了!_飘渺Jam的博客-CSDN博客_etl

ETL工具的比较!

四种数据处理方式比较:传统 ETL 工具、Mapreduce、Hive、Spark

常见ETL平台:

Kettle:

互联网巨头(比如BAT)的数据平台几乎都是hadoop,spark的框架,因为数据是海量的。即便kettle有可取之处,也会被改得面目全非,因为这些公司大都是研发狂魔啊。。。

小公司使用kettle居多,开源成本低,部署极其方便,一台普通的服务器,甚至本地PC就可以随意折腾。作用还是ETL工具,做数据处理用。再搭一些开源的报表平台出BI报表。据我所知,顺网科技旗下公司有在用~这个算有名么。。。

另外传统的金融IT(主要是各大银行)妥妥地会购买整套的商用BI,财大气粗,关键是懒

总之,kettle本质上就是java编写的数据处理程序,但数据量是其瓶颈。
【作者:一介布衣;链接:https://www.zhihu.com/question/46990569/answer/107046866】

Apache - Airbnb airflow:airflow 介绍 - 简书

Apache Nifi 概述:Apache NiFi 概述_张伯毅的专栏-CSDN博客_apache nifi

数据处理大厂:Oracle,Apache

Oracle是啥?甲骨文(中国)软件系统有限公司_百度百科

大名鼎鼎的Apache是啥?apache(Apache软件基金会)_百度百科

Hadoop

Admaster数据挖掘总监 随着互联网、移动互联网和物联网的发展,谁也无法否认,我们已经切实地迎来了一个海量数据的时代,数据调查公司IDC预计2011年的数据总量将达到1.8万亿GB,对这些海量数据的分析已经成为一个非常重要且紧迫的需求。

随着互联网、移动互联网和物联网的发展,谁也无法否认,我们已经切实地迎来了一个海量数据的时代,数据调查公司IDC预计2011年的数据总量将达到1.8万亿GB,对这些海量数据的分析已经成为一个非常重要且紧迫的需求。

Hadoop在可伸缩性、健壮性、计算性能和成本上具有无可替代的优势,事实上已成为当前互联网企业主流的大数据分析平台。本文主要介绍一种基于Hadoop平台的多维分析和数据挖掘平台架构。作为一家互联网数据分析公司,我们在海量数据的分析领域那真是被“逼上梁山”。多年来在严苛的业务需求和数据压力下,我们几乎尝试了所有可能的大数据分析方法,最终落地于Hadoop平台之上。

大数据架构hadoop - zhanghaiyang的个人空间 - OSCHINA - 中文开源技术交流社区

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-11-25 08:11:03  更:2021-11-25 08:13:33 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 7:53:37-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码