知识图谱

什么是知识图谱?

知识图谱: 是一种用图模型来 描述知识 和 建模世界万物之间关联关系 的一种技术方法 知识图谱由节点和边组成 节点表示实体,实体可以是抽象出来的类,也可以是具体的对象实例,甚至是基本的字面量。 类是抽象的实体,用于归纳具有相同属性的实体,类和从属的实体之间是上下位关系。 通过抽取类,建设上下位关系,可以帮助我们整理实体属性,更好的理解实体,有助于后续的推理。 边表示实体的属性,分为对象属性(实体的外部关系)和 数据属性(实体的内部特征) 以SPO三元组(Subject-Predicate-Object)的形式来表示: 对象属性表示为 <类/对象实例,关系,类/对象实例> 数据属性表示为 <类/对象实例,属性,字面量>

知识图谱的演变

知识图谱演变.png

1. 语义网络: 知识表示方法, 用相互连接的节点和边来表示知识。 节点表示对象、概念,边表示节点之间的关系 问题: 节点和边的定义没有标准,无法对节点和边进行定义 2. 语义网(semantic web) , 链接数据(linked data) 这两个倾向于描述万维网中资源、数据之间的关系 语义网: 也指代其相关的技术标准。 是为了使得网络上的数据变得机器可读而提出的一个通用框架。 是知识表示和推理在web中的应用 链接数据: 起初是用于定义如何利用语义网技术在网上发布数据,其强调在不同的数据集间创建链接 3. 知识图谱 可看做是 语义网(semantic web)简化后的商业实现 是由本体(Ontology)作为Schema层,和RDF数据模型兼容的结构化数据集

为什么需要知识图谱?

不要无意义的字符串,而是获取字符串背后隐含的对象或事物, 让机器能理解数据的关联

  • 价值:
    • 提升搜索引擎的能力
    • 辅助智能问答
    • 自然语言处理
    • 大数据分析
    • 推荐计算
    • 物联网设备互联
    • 可解释性人工智能
    • 等等

如何构建一个知识图谱?

知识建模、知识存储、知识抽取、知识融合、知识计算以及知识应用

  • 技术流程
    1. 确定知识表示模型
    2. 根据数据来源选择不同的知识获取手段导入知识
    3. 利用知识推理,知识融合,知识挖掘等技术对构建的知识图谱进行质量提升
    4. 根据场景需求设计不同的知识访问和呈现方法,如语义搜索,问答交互,图谱可视化分析等
  • 辅助理解图
    五步走.png

通用知识图谱 和 垂直领域知识图谱

目前知识图谱的大类划分: 通用知识图谱, 垂直领域的专业知识图谱

垂直领域知识图谱.png

如何进行知识建模

重点: 知识表示

知识表示

W3C 提出的一套标准语言: RDF, RDFS, OWL

  • RDF

是关于知识图谱的国际标准,是一系列语义网标准的核心 是一个抽象的数据模型, 有多种序列化格式 在RDF中, 知识都以 SPO 三元组形式出现 主语是 一个个体(individual) 谓语是 一个属性 ( 属性连接两个个体,或者连接 个体和字面量 ) 宾语是 一个个体 或 一个字面量(数据类型的实例) 一个RDF知识库 就可以看成是一个图, 或者是一个知识图谱

  • RDFS

描述个体之间的关系: 类, 属性 类,属性 就是 模式scheme定义 RDFS 就是 RDF scheme , 是对RDF数据提供 类,属性的描述,提供词汇建模 本质上是一些预定义词汇(vocabulary)构成的集合,用于对RDF进行类似的类定义及其属性的定义 rdf:type 指定个体的类 rdfs:subClassOf 指定类的父类 rdfs:subPropertyOf 指定属性的父属性 rdfs:domain 指定属性的定义域 rdfs:range 指定属性的值域

  • OWL

Web Ontology Language : 网络本体语言 1. 提供快速、灵活的数据建模能力。 2. 高效的自动推理。 一个表达能力更强的本体语言, 是W3C扩展RDFS作为语义网上的推荐语言 其本质上同样是一些预定义词汇(vocabulary)构成的集合,用于对RDF数据进行更强的表达 属性特征词汇 owl:DatatypeProperty. 数据属性 owl:ObjectProperty. 对象属性 owl:TransitiveProperty. 表示该属性具有传递性质 owl:SymmetricProperty. 表示该属性具有对称性 本体映射词汇 owl:equivalentClass. 表示某个类和另一个类是相同的。 owl:equivalentProperty. 表示某个属性和另一个属性是相同的。 owl:sameAs. 表示两个实体是同一个实体。

建模方式

  • 自顶向下(Top-Down)

首先为知识图谱定义数据模式, 数据模式从最顶层概念构建, 逐步向下细化,形成结构良好的分类学层次, 然后再将实体添加进概念。

  • 自底向上(Bottom-Up)

首先对实体进行归纳组织,形成底层概念, 然后逐步往上抽象,形成上层概念。 该方法可基于行业现有标准转换生成数据模式,也可基于高质量行业数据源映射生成。

自底向上: 适合构建通用领域知识图谱,以及数据、业务非常之复杂的某些行业领域知识图谱

自顶向下: 适合构建垂行业直领域知识图谱

建模实践 ( 智慧校园物联网行业知识图谱 - 辅助搜索 )

自顶向下进行设计,进行单一领域的专业知识图谱构建

智慧校园建模.png

  • 关系

标签 打在 内容,角色 上 角色 拥有 内容 产品 应用于 方案 产品,方案 应用于 案例 案例 实施于 省份 用户 拥有 企业 企业 拥有 产品,方案,案例 企业 位于 省份