知识图谱学习笔记(一)
仅记录个人学习历程,内容来源于网络及书籍,侵删
关于知识图谱:
知识图谱的概念:
知识图谱(Knowledge Graph)又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系 “知识图谱本质上是语义网络(Semantic Network)的知识库”。
知识图谱的主要研究内容:
1.知识表示
以结构化的形式描述客观世界的概念,实体,及其关系。通常是基于RDF规范的三元组知识表示形式。
2.构建知识库
将知识从非结构化、半结构化的数据中提取出来,包括命名实体识别(NER)、命名实体的链接与关系的抽取。
3.知识推理
从给定的知识图谱中推导出新的实体与实体之间的关系
4.知识应用
自动问答技术、自然语言处理等
关于知识表示:
指计算机表达知识的数据结构,涉及知识获取、知识清洗、知识提取等。 表示方法通常有基于逻辑的知识表示、产生式表示方法、语义网络表示方法、框架表示方法以及脚本知识表示方法等。
知识推理
根据已有的知识图谱中的事实或者关系推断出新的事实与关系,一般是考察实体、关系和图谱结构三个方面的信息特征。
知识存储
知识图谱的知识存储一般是采用图形数据库进行存储,主要有两种图数据模型:RDF图和属性图(Property Graph) 属性图是草根自发的,但最终得到了市场的认可,现在主要是中小企业在用。 查询语言:RDF图:SPARQL; 属性图:Cypher 和 Gremlin 常见图形数据库
基于关系数据库的存储方案
主要是三元组表(3store)、水平表(DLDB)、属 性表(JENA)、垂直划分(SW-Store)、DB2RDF和六重索引(RDFX-3X、Hexastore) 面向RDF的三元组数据库 Jena RDF4J RDF-3X gStore
原生图数据库 Neo4j
分布式图形数据库 JanusGraph、 OrientDB、 Cayley
|