7.1 数据体系规划
各种系统产生的原始数据堆积在一起导致使用成本非常高,这类数据只能在某些数据技术基础非常好的部门使用,而且会经常出现
命名不一、口径不一的问题,从而导致整个企业的数据无法真正用起来。数据中台数据体系是在全域原始数据的基础上,进行标准定义
及分层建模,数据体系建设最终呈现的结果是一套完整、规范、准确的数据体系,可以方便的支撑数据应用。
中台数据体系应具备以下特征:
1.覆盖全域数据
数据集中建设,覆盖所有业务过程数据,业务在中台数据体系中总能找到需要的数据。
2.结构层次清晰
纵向的数据分层,横向主题域、业务过程划分,让整个层次结构清晰易理解。
3.数据准确一致
定义一致性指标,统一命名、统一业务含义,统一计算口径,并有专业团队负责建模,保证数据的准确一致。
4.性能提升
统一的规划设计,选用合理的数据模型,清晰的定义并统一规范,并且考虑使用场景,使用整体性能更好。
5.降低成本
数据体系的建设使得数据能被业务共享,这避免了大量烟囱式的重复建设,节省了计算、存储和人力成本。
6.方便易用
易用的总体原则是越往后越能方便的直接使用数据,把一些复杂的处理尽可能前置,必要时做适当的冗余处理。比如在数据的
使用中,可以通过维度冗余和事实冗余来提前进行相关处理,以避免使用时才计算,通过公共计算下沉、明细与汇总共存等为业务
提供灵活性。统一数据体系的建设让整个企业的业务都有机会使用数据。
为了使数据体系在建设使具备以上特征,需要一个体系化的数据层次架构,这个层次架构定义了数据分层及每一层的建模建设规范。数据
体系架构是一套指导规范,在实施过程中应严格按照架构执行。数据中台体系架构涉及以下4个数据分层:
1
|