| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> 大数据--数据仓库--数仓分层和架构 -> 正文阅读 |
|
[大数据]大数据--数据仓库--数仓分层和架构 |
目录 1.1 数仓分层规范?1.1.1? 为什么需要数据建模??????大数据系统需要数据模型方法来帮助更好的组织和存储数据,以便在性能,成本,效率和质量之间取得最佳平衡。
1.1.2 维度模型????维度模型是数据仓库工程领域最流行的数据仓库建模的经典。 ????维度建模从分析决策的需求出发构建模型,为分析需求服务,因此它重点关注用户如何更快速地完成需求分析,同时具有较好的大规模复杂查询的响应性能。其典型的是星型模型,以及在一些特殊场景下使用的雪花模型。 1.1.3 标准数仓分层????目前教学或者书籍上最经典的分层是分为五层。依次为ODS,DWD,DWS,DWT,ADS层。
?????????????????????创建分区表,防止后续全表扫描; ?????????????????????采用压缩,减少磁盘存储空间。
????????????采用标准的建模四步:选择业务过程,声明粒度,确定维度,确认事实 。
1.1.4 其他数仓分层????????一些企业会分成A,B,C层
????????????ODS:原始数据层,同标准数仓分层中的ODS 层。
????????????事实层(fact):同标准数仓分层中的DWD层。 ????????????原件层(unit):同标准数仓层中的DWS层,另外除了有累计事实都设计,还会有事实 ? ? ? ? 解耦的设计。 ????????????主题层(topic):进行维度退化,字段冗余,构建一个公共宽表。 ????????????聚合层(aggr):进行轻度聚合,类似于=标准数仓中的DWT层。
应用层(app):根据需求计算指标
维度表:贯穿整个数仓。进行维度关联的时候使用。 1.2 常见的数据架构1.2.1 传统关系数据库--范式建模????1. 范式建模目的
???2.函数依赖
????(学号,课程名称)--> (课程分数),但是左侧中单独一个是推到不出分数的。
????????????????(学号,课程名称) → (姓名)。但是只通过学号这一列也可以推导出姓名,所以课程名称这一列是多余的。
??????(学号)--> (系名) → (系主任)。但是学号推导不出系主任。 ????3.范式分类
1.2.2 .Kimball架构和Inmon架构????1.Kimball ?????????Kimball主要探讨需求分析,高层模型,详细模型,模型审查整个过程。
???2.Inmon ??????模型的定位:扮演着通往数据仓库其他部分的智能线路图的角色,划分为三个层次。
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/23 16:51:11- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |