v0.6.0知识库模块整体操作流程和之前保持一致,在之前版本能力的基础上新增以下能力:

  • GraphRAG社区总结
  • QA文档召回
  • 知识库召回测试

GraphRAG社区总结能力

如何使用参考 GraphRAG

QA文档召回

知识库在原有召回能力基础上新增QA文档召回能力,针对手动关联问题的chunk和document优先返回召回内容。

使用场景:针对原有向量召回完整性和准确性不足的时候,通过绑定问题直接召回与问题相关的文档,过滤掉不相干的文档chunk干扰。

  1. 针对chunk关联问题

知识库 - 图1

知识库 - 图2

  1. 针对关联的问题进行召回测试,只返回管理问题的文档块内容

知识库 - 图3

3.针对文档关联问题

使用场景,针对知识空间存在多份文档,并且针对特定问题召回内容完整性不够时,对文档进行问题关联能够大大提高召回命中率。

知识库 - 图4

知识库召回测试

召回测试可以在知识库构建完成后进行召回测试

  1. 进入召回测试页面

知识库 - 图5

  1. 输入问题进行召回验证

知识库 - 图6

  1. 调整召回参数

知识库 - 图7

  • Topk: 返回topk条数据,默认值1
  • 召回方法
    1. qa_retriever:针对手动添加关联问题的chunk,document优先进行召回
    2. embedding_retriever:向量召回
  • score阈值:通过设置召回得分阈值返回大于得分阈值的数据,过滤掉得分小于阈值的数据。