问题:“数据-信息-知识”转化
解决:自顶向下和自底向上结合,构建知识图谱
具体:自顶向下构建模式层:围绕自然灾害事件、灾害应急任务、灾害数据、模型方法 4个要素
自底向上构建数据层:通过数据获取、知识抽取、融合、存储建立实体间关联关系
模式层:概念节点集合+概念关系边集合
EmergencyOntology= {DisasterEvent,DisasterTask,DisasterData,DisasterMethod,Relation}
DisasterEvent= {Event_Concept, Event_Property, Event_Relation, Event_Restriction,Event_Instance}
DisasterTask={Task_Concept,Task_Property,Task_Relation,Task_Restriction,Task_Instance}
DisasterData ={Data_Concept,Data_Property, Data_Relation, Data_Restriction, Data_Instance}
DisasterMethod={Method_Concept,Method_Property,Method_Relation,Method_Restriction,Method_Instance}
数据层:实体节点集合+实体属性关系边集合+实体语义关系边集合
1、数据获取:a)结构化:直接提取 b)半结构化:解析网页结构+爬虫 c)非结构化:文献搜索+爬虫
2、实体及关系抽取:a)结构化:关系数据库 b、c)半结构化+非结构化:文本处理+监督学习(灾害、任务、数据:实体名称字典+实体名称匹配;模型:CRF、BIEO、F度量、规则匹配)
3、数据融合:采用聚类、阈值设置的方法进行实体对齐以解决数据冗余问题
4、知识储存:图数据库Neo4j(图查询语言、图挖掘算法)
知识点:
1、三元组:“实体-关系-实体”or“实体-属性-属性值”
