学习路径:
- 综述参考 http://jos.org.cn/html/2019/7/5841.htm 综述参考2
- 理清RDF图和属性图的区别
- 学习RDF、RDFs/OWL
- 学习本体构建工具 protege
- 学习RDF存储数据库 gstore
- 学习信息抽取算法——命名实体识别、关系抽取、属性抽取
- 学习知识融合算法(实体链接算法)——命名实体识别、指代消歧、实体消歧
- 学习知识应用算法——智能问答、反欺诈、知识推荐等
常见知识图谱数据库管理系统的比较
类型 | 名称 | 许可证 | 数据模型/存储方案 | 查询语言 | 特点描述 | 最新版本 | 是否活跃 |
---|---|---|---|---|---|---|---|
基于关系 | 3store | 开源 | RDF图/三元组表 | SPARQL | 早期系统, 三元组表存储方案的代表性系统 | 3.0.17 (2006-7-17) | 否 |
DLDB | 研究原型 | RDF图/水平表 | SPARQL | 早期系统, 水平表存储方案的代表性系统 | 已不维护 | 否 | |
Jena | 开源 | RDF图/属性表 | SPARQL | 主流的语义Web工具库、RDF数据库和OWL推理工具 | 3.10.0 (2018-12-30) | 是 | |
SW-Store | 研究原型 | RDF图/垂直划分 | SPARQL | 科研原型系统, 垂直划分存储方案的代表性系统 | 已不维护 | 否 | |
IBM DB2 | 商业 | RDF图/DB2RDF | SPARQL/ SQL | 支持RDF的主流商业数据库 | 11.1 (2016-4-12) | 是 | |
Oracle 18c | 商业 | RDF图/关系存储 | SPARQL/ PGQL | 支持RDF的主流商业数据库 | 18c (2018-2-5) | 是 | |
RDF三元组库 | RDF4J | 开源 | RDF图/SAIL API | SPARQL | 主流的语义Web工具库、RDF数据库、提供SAIL接口 | 2.5.0 (2019-3-7) | 是 |
RDF-3X | 开源 | RDF图/六重索引 | SPARQL | 科研原型系统, 六重索引存储方案的代表性系统 | 0.3.8 (2013-11-22) | 否 | |
gStore | 开源研究原型 | RDF图/VS*树 | SPARQL | 科研原型系统, 原生图存储, 使用了基于位串图存储技术 | 0.7.2 (2018-11-4) | 是 | |
Virtuoso | 商业/开源 | RDF图/多模型混合 | SPARQL/ SQL | 语义Web项目常用的RDF数据库, 基于成熟的SQL引擎 | 8.2 (2018-10-22) | 是 | |
AllegroGraph | 商业 | RDF图/三元组索引 | SPARQL | 对语义推理功能具有较为完善的支持 | 6.5.0 (2019-3-4) | 是 | |
GraphDB | 商业 | RDF图/三元组索引 | SPARQL | 支持语义Web标准的主流产品, 支持SAIL层推理功能 | 8.8.1 (2019-1-30) | 是 | |
BlazeGraph | 商业 | RDF图/三元组索引 | SPARQL/ Gremlin | 基于RDF三元组库的图数据库, 实现了SPARQL和Gremlin | 2.1.4 (2016-8-30) | 否 | |
StarDog | 商业 | RDF图/三元组索引 | SPARQL | 对OWL2推理机制具有良好的支持 | 6.1.2 (2019-3-7) | 是 | |
原生图数据库 | Neo4j | 商业/开源 | 属性图/原生图存储 | Cypher | 最流行的图数据库, 基于属性图模型, 实现了原生优化存储 | 3.5.3 (2019-2-11) | 是 |
JanusGraph | 开源 | 属性图分布式存储 | Gremlin | 分布式图数据库, 存储后端与查询引擎分离, 实现了Gremlin | 0.2.2 (2018-10-9) | 是 | |
OrientDB | 商业 | 属性图/原生图存储 | SQL/ Gremlin | 支持多模型的原生图数据管理系统, 对数据模式的灵活支持 | 3.0.17 (2019-3-7) | 是 | |
Cayley | 开源 | RDF图/外部存储 | Gremlin/ GraphQL | 轻量级开源图数据库, 易于扩展对新语言和存储后端的支持 | 0.7.5 (2018-11-27) | 是 | |
分布式系统与框架 | Sempala | 开源研究原型 | RDF图/分布式存储 | SPARQL | 基于HDFS存储, 使用Impala SQL引擎的RDF三元组库 | 2.1 (2017-7-7) | 否 |
TriAD | 开源研究原型 | RDF图/分布式存储六重索引 | SPARQL | 基于MPI框架的异步通信协议 | GitHub源码未发布 | 否 | |
H2RDF+ | 开源研究原型 | RDF图/分布式存储六重索引 | SPARQL | 基于HBase构建六重索引 | GitHub源码未发布 | 否 | |
S2RDF | 开源研究原型 | RDF图/分布式存储垂直划分 | SPARQL | 基于Spark框架建立大量索引 | 1.1 (2016-4-4) | 否 | |
Stylus | 开源研究原型 | RDF图/分布式存储属性表优化 | SPARQL | 基于分布式内存键值库的RDF三元组库 | GitHub源码未发布 | 否 | |
Apache Rya | 开源 | RDF图/分布式存储三元组索引 | SPARQL | 基于列存储Accumulo的RDF三元组库 | 3.2.12 (2018-03-04) | 是 | |
Cypher for Apache Spark | 开源 | 属性图/分布式存储DataFrame | Cypher | 基于Spark框架的Cypher引擎 | 0.3.0 (2019-3-8) | 是 |