| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> Kylin简述 -> 正文阅读 |
|
[大数据]Kylin简述 |
一、Kylin简介kylin是什么Apache Kylin是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。(OLAP(on line analytical processing)联机分析处理 是一种软件技术,应用于数据仓库分析处理。它使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。从各方面观察信息,也就是从不同的维度分析数据,因此OLAP也成为多维分析。提供决策支持,多应用于数据仓库。 Kylin的核心思想是预计算。 理论基础是:以空间换时间。即多维分析可能用到的度量进行预计算,将计算好的结果保存成Cube并存储到HBase中,供查询时直接访问。
数据仓库数据仓库是商业智能的核心部分,主要是将不同数据源的数据整合到一起,通过多维分析为企业提供决策支持报表生成等。存入数据仓库的资料必定包含时间属性。 数据仓库和数据库主要区别:
OLAP和OLTP
维度和度量
Kylin的优势Apache Kylin?的主要特点包括支持?SQL 接口、支持超大数据集、亚秒级响应、可伸缩性、高吞吐率、BI?工具集成等。
Kylin技术架构
Kylin构建在Hadoop等分布式计算平台之上。主要是对hive中的数据进行预计算,充分利用hadoop的mapreduce框架的并行处理能力实现,用户只需提前定义好查询维度,Kylin将会帮助我们进行计算,并将结果存储到HBase中,为海量数据的查询和分析提供亚秒级返回,是空间换时间的解决方案。需要大量的存储空间(原数据量的10+倍)。 二、kylin搭建需完成hadoop,hbase,hive等前提,详情可见我之前的博客。 准备工作kylin安装包下载:Apache Kylin | 下载?或者Index of /dist/kylin 上传安装包至node001 解压
改名
搭建配置文件环境配置
末行加入:
??重新加载配置文件:
find-hbase-dependency.sh
修改这一行为自己的hbase-common-jar包 启动测试启动:jobhistory
启动zookeeper(集群记得每个节点都要启动)
启动Hadoop集群
启动hbase
启动kylin
访问web页面
此文是对kylin的简述,今后将会整理发布kylin的基本操作,简单优化等内容 参考资料kylin百度百科 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/23 5:21:55- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |