| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> 数据仓库的一些知识 -> 正文阅读 |
|
[大数据]数据仓库的一些知识 |
(1)什么是数仓?数据仓库是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,用于对管理决策过程的支持。 面向主题:基于某个明确的主题,仅需要与该主题相关的数据 集成的:从不同的数据源采集数据到同一个数据源,此过程会有一些ETL操作。 随时间变化的:关键数据隐式或者显式的基于时间变化 相对稳定:数据仓库的数据一般是反应相当长一段时间内的数据内容 (2)为什么要对数据仓库进行建模?清晰、性能、质量、效率 (3)关于 OLTP、OLAPOLTP翻译为联机事务处理, OLAP翻译为联机分析处理,从字面上来看OLTP是做事务处理,OLAP是做分析处理。 从对数据库操作来看,OLTP主要是对数据的增删改,OLAP是对数据的查询。 有下图: (4)关于数仓cube举一个例子: 对一个cube经常会有的操作? 切片、切块等 (5)阿里的ONEDATE数仓模型大致如下 ?具体数仓构建: (6)关于数据模型分类? 一些术语 (7)关于ER建模和维度建模1、ER模型常用于OLTP数据库建模,应用到构建数仓时更偏重数据整合, 站在企业整体考虑,将各个系统的数据按相似性一致性、合并处理,为数据分析、决策服务,但并不便于直接用来支持分析。缺陷:需要全面梳理企业所有的业务和数据流,周期长,人员要求高。
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/24 6:38:37- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |