1、摘要
??首先看一下这篇文章的五个关键词:
关
键
词
:
{
数
据
资
产
目
录
数
据
资
产
地
图
数
据
血
缘
关
系
数
据
链
路
知
识
图
谱
关键词: \left\{ \begin{matrix} 数据资产目录 \\ 数据资产地图 \\ 数据血缘关系 \\ 数据链路 \\ 知识图谱 \end{matrix} \right.
关键词:????????????数据资产目录数据资产地图数据血缘关系数据链路知识图谱? ??接着就着关键词提炼摘要: ??动机:为落实国网公司新的战略部署,公司组织制定了企业中台建设方案,引入了数据资产管理。 ??方法:1、运用知识图谱技术,构建数据资产地图管理模型。2、以微服务的架构,发布数据资产目录。 ??作用:1、提供丰富的业务视图、数据视图溯源和可视化展现。2、提高数据资产管理能力,让用户能灵活定制业务应用场景和追溯业务应用源数据等,持续挖掘数据价值。
2、前言
??细化摘要:1、为推进企业中台建设 ,通过数据资产目录建设、数据质量治理提升实现数据资产管理。2、通过数据资产地图模型构建,提供业务、数据视图的溯源和可视化展现能力,提升数据的运营管理能力和共享共用能力,为实现数据全生命周期管控提供基本工具。
3、研究概述
3.1 数据资产管理内涵
??数据资产管理的主要目标:提升数据资产标准化、精益化、信息化管理水平。 ??数据资产管理的主要理念和方法:统筹协调资产在规划、设计、建设、运维、改造、退役处置等全生命周期的管理行为和技术要求。 ??数据资产管理的核心:把数据对象作为一种全新的资产形态,不再将数据局限于单一的业务部门和领域,从总体视角重新构建数据与数据之间的综合关联和潜在联系,以构建公司数据资产管理体系为目标,开展包括数据资产治理、数据资产运营和数据资产应用的数据资产管理工作。
3.2 数据资产管理的意义
??数据资产管理是国网安徽电力实现电力物联网的重要内容,是数据中台的重要应用之一。通过数据资产梳理,发布资产目录,提供完善的企业核心数据资源索引工具;通过前瞻性的设计业务视图、数据视图模型并采用可视化手段固化成果,构建数据资产视图,为数据资产全生命周期管理提供有效工具,为公司数据资产统一管控、应用,建立公司核心数据资源的流程化管理机制,提升数据集成和服务能力,促进数据与业务的共享融合以及为数据价值的深度挖掘奠定基础。
4、研究内容
4.1 研究思路
??基石:基于国网安徽电力全业务统一数据中心现有建设成果以及接入的35套系统。 ??方法: ??1、应用包括知识获取、知识融合、知识计算及应用的知识图谱技术,通过大量的机器学习等自然语言处理技术(NLP),对电网知识资源及其载体进行挖掘、分析、构建、计算。 ??2、运用多种可视化方法,绘制和展示电网知识资源及他们之间的相互联系形成知识图谱,实现从非结构化、半结构化、结构化数据中获取电网知识,融合构建不同数据源知识关联,并基于知识图谱计算功能进行知识图谱的应用。 ??3、以微服务架构,发布数据资源目录,结合数据资产视图使用,可以对业务视图溯源数据视图,数据视图溯源实体表,实体表查询血缘关系,追溯源表、源系统、源功能,查询业务数据、实体表源数据等。
4.2 研究内容
??1、知识图谱: ??个性化推荐系统主要用知识图谱特征学习和推荐系统相结合,通常有如下三种方式实现个性化推荐,如图1所示:
图1:知识图谱的个性化推荐方式
??2、
数据资产目录:
??
定义:数据资产目录,是按照分类、主题、应用多个角度对数据资产进行管理、识别、定位、发现、评估、共享的数据组织管理工具。
??
作用:通过数据资产目录的建立,可以实现数据资源的智能搜索、数据资产台账信息展示、数据集成服务能力提升以及建立数据资源全生命周期管理工具,一方面可以盘活企业数据资产当前分布情况和资产质量,另一方面也可以作为一种语义层抽象,用于驱动整个企业数据资产的加工处理过程。如图2所示。
图2:数据资产管理整体方案
??
数据资产目录的构建主要分为以下3步:
(1) 数据资源盘点,梳理表与功能对应关系。全面梳理接入业务系统和数据模型数据字典,开展数据表、字段的中文描述补充完善工作及系统功能与表对应关系的梳理逐步完善,形成真实完整的数据字典档案;
(2) 流转链路解析,识别标记数据来源。通过ETL解析工具,解析OGG、Informatica工具的配置文件或资源库信息,分析ETL过程的源表、目标表。依据数据字典,梳理数据流转路径,标识数据来源和链路关系;
(3) 构建数据资产目录,面向各部门、单位发布。从公司数据资源分类、数据信息描述范式等方面,制定目录结构规范;构建覆盖“系统-功能-表-字段”的数据资产目录,从统一权限系统获取系统功能菜单,梳理每项功能对应数据表目录表间数据流转关系,进一步形成“业务-数据”的对应关系,发布数据资产目录。
??3、
数据资产地图
??从公司业务结构出发,基于通用业务建模及数据视图建模方法,通过业务和数据映射关系建立、业务视图溯源、数据视图溯源、业数视图可视化开发四个步骤构建数据资产地图,包括业务视图、数据视图及业务和数据视图之间映射关系,梳理识别数据资产及数据资产关系全貌。
??以上,我对这篇文章的概念进行了一定的整理。《基于知识图谱技术的数据资产管理设计与应用验证研究》的作者:
|