DB-GPT``v0.6.0
联合TuGraph
社区和AntV
社区共同发布了GraphRAG
社区总结能力。
“讲了个啥?”,“DB-GPT
社区和TuGraph
社区在社区贡献,社区生态,开发者的这几个方面的联系和区别分别是什么” 这类概括性,多主题总结性问题时,传统Native RAG
可能无法解决。因为这是一个聚焦于查询的总结性QFS
检索(Query-Focused Summarization),而不是一个直接明确的向量/关键词检索。
大致原理是通过大模型进行三元组抽取,并且利用社区检测算法(Leiden
算法)将整个知识内容图节点划分模块化的社区,然后通过大模型对社区进行摘要总结,实现QFS
,具体原理后面会有剖析。
基于上述设计,我们采用了TuGraph社区提供的开源知识图谱语料(OSGraph)以及DB-GPT和TuGraph的产品介绍材料(共计约43k tokens),并与Microsoft的GraphRAG系统做了对比测试,最终DB-GPT仅消耗了相比50%的token开销,便生成了同等规模的知识图谱。并且在问答测试质量相当的前提下,全局搜索性能有明显提升。
安装教程
- 安装
TuGraph
环境
docker run -d -p 7070:7070 -p 7687:7687 --name tugraph tugraph/tugraph-runtime-centos7:latest lgraph_server -d run --enable_plugin true
- 安装相关依赖
pip install "neo4j>=5.20.0"
pip install dbgpt-tugraph-plugins==0.1.0rc1 -U -i https://pypi.org/simple
3.在.env
里面进行设置
TUGRAPH_HOST=127.0.0.1
TUGRAPH_PORT=7687
TUGRAPH_USERNAME=admin
TUGRAPH_PASSWORD={your_password}
#开启图社区总结能力
GRAPH_COMMUNITY_SUMMARY_ENABLED=True
4.启动dbgpt_server
如何使用
- 新建
KnowledgeGraph
知识库
2.上传文档然后切片处理
3.构建成功后,查看图谱
4.进行对话