知识图谱

知识图谱

什么是知识图谱?

知识图谱：是一种用图模型来描述知识和建模世界万物之间关联关系的一种技术方法知识图谱由节点和边组成节点表示实体，实体可以是抽象出来的类，也可以是具体的对象实例，甚至是基本的字面量。类是抽象的实体，用于归纳具有相同属性的实体，类和从属的实体之间是上下位关系。通过抽取类，建设上下位关系，可以帮助我们整理实体属性，更好的理解实体，有助于后续的推理。边表示实体的属性，分为对象属性（实体的外部关系）和数据属性（实体的内部特征）以SPO三元组(Subject-Predicate-Object)的形式来表示: 对象属性表示为 <类/对象实例，关系，类/对象实例> 数据属性表示为 <类/对象实例，属性，字面量>

知识图谱的演变

知识图谱演变.png

1. 语义网络：知识表示方法, 用相互连接的节点和边来表示知识。节点表示对象、概念，边表示节点之间的关系问题: 节点和边的定义没有标准，无法对节点和边进行定义 2. 语义网（semantic web） , 链接数据（linked data）这两个倾向于描述万维网中资源、数据之间的关系语义网: 也指代其相关的技术标准。是为了使得网络上的数据变得机器可读而提出的一个通用框架。是知识表示和推理在web中的应用链接数据: 起初是用于定义如何利用语义网技术在网上发布数据，其强调在不同的数据集间创建链接 3. 知识图谱可看做是语义网（semantic web）简化后的商业实现是由本体（Ontology）作为Schema层，和RDF数据模型兼容的结构化数据集

为什么需要知识图谱？

不要无意义的字符串，而是获取字符串背后隐含的对象或事物，让机器能理解数据的关联

价值：
- 提升搜索引擎的能力
- 辅助智能问答
- 自然语言处理
- 大数据分析
- 推荐计算
- 物联网设备互联
- 可解释性人工智能
- 等等

如何构建一个知识图谱？

知识建模、知识存储、知识抽取、知识融合、知识计算以及知识应用

技术流程
1. 确定知识表示模型
2. 根据数据来源选择不同的知识获取手段导入知识
3. 利用知识推理，知识融合，知识挖掘等技术对构建的知识图谱进行质量提升
4. 根据场景需求设计不同的知识访问和呈现方法，如语义搜索，问答交互，图谱可视化分析等
辅助理解图

通用知识图谱和垂直领域知识图谱

目前知识图谱的大类划分：通用知识图谱，垂直领域的专业知识图谱

垂直领域知识图谱.png

如何进行知识建模

重点：知识表示

知识表示

W3C 提出的一套标准语言: RDF, RDFS, OWL

是关于知识图谱的国际标准，是一系列语义网标准的核心是一个抽象的数据模型，有多种序列化格式在RDF中，知识都以 SPO 三元组形式出现主语是一个个体（individual）谓语是一个属性（属性连接两个个体，或者连接个体和字面量）宾语是一个个体或一个字面量(数据类型的实例) 一个RDF知识库就可以看成是一个图，或者是一个知识图谱

RDFS

描述个体之间的关系：类，属性类，属性就是模式scheme定义 RDFS 就是 RDF scheme , 是对RDF数据提供类，属性的描述，提供词汇建模本质上是一些预定义词汇（vocabulary）构成的集合，用于对RDF进行类似的类定义及其属性的定义 rdf:type 指定个体的类 rdfs:subClassOf 指定类的父类 rdfs:subPropertyOf 指定属性的父属性 rdfs:domain 指定属性的定义域 rdfs:range 指定属性的值域

Web Ontology Language : 网络本体语言 1. 提供快速、灵活的数据建模能力。 2. 高效的自动推理。一个表达能力更强的本体语言，是W3C扩展RDFS作为语义网上的推荐语言其本质上同样是一些预定义词汇（vocabulary）构成的集合，用于对RDF数据进行更强的表达属性特征词汇 owl:DatatypeProperty. 数据属性 owl:ObjectProperty. 对象属性 owl:TransitiveProperty. 表示该属性具有传递性质 owl:SymmetricProperty. 表示该属性具有对称性本体映射词汇 owl:equivalentClass. 表示某个类和另一个类是相同的。 owl:equivalentProperty. 表示某个属性和另一个属性是相同的。 owl:sameAs. 表示两个实体是同一个实体。

建模方式

自顶向下（Top-Down）

首先为知识图谱定义数据模式，数据模式从最顶层概念构建，逐步向下细化，形成结构良好的分类学层次，然后再将实体添加进概念。

自底向上（Bottom-Up）

首先对实体进行归纳组织，形成底层概念，然后逐步往上抽象，形成上层概念。该方法可基于行业现有标准转换生成数据模式，也可基于高质量行业数据源映射生成。

自底向上: 适合构建通用领域知识图谱，以及数据、业务非常之复杂的某些行业领域知识图谱

自顶向下: 适合构建垂行业直领域知识图谱

建模实践（智慧校园物联网行业知识图谱 - 辅助搜索）

自顶向下进行设计，进行单一领域的专业知识图谱构建

智慧校园建模.png

关系

标签打在内容，角色上角色拥有内容产品应用于方案产品，方案应用于案例案例实施于省份用户拥有企业企业拥有产品，方案，案例企业位于省份

知识图谱

知识图谱

什么是知识图谱?

知识图谱的演变

为什么需要知识图谱？

如何构建一个知识图谱？

通用知识图谱 和 垂直领域知识图谱

如何进行知识建模

知识表示

建模方式

建模实践 （ 智慧校园物联网行业知识图谱 - 辅助搜索 ）

通用知识图谱和垂直领域知识图谱

建模实践（智慧校园物联网行业知识图谱 - 辅助搜索）