:::color1 🎯 当下,企业在做垂直应用方案落地时,会在 “RAG+**通用大模型” 以及“RAG+微调**大模型” 上难以抉择。 有人认为,基于“通用”大模型的RAG 知识库方案就能实现业务场景。 而有时会发现,仍然无法满足预期要求,而到底什么时候才应该选择微调,而不是优化我的 RAG 方案? 这个界限如何找?

:::

“通用”大模型:指的没有做过微调的大模型,比如大家熟知的 gpt-4、Qwen、Baichuan、Llama 等等。

的确,这个界限很难找,因为你也不知道,是目前你的 RAG 方案本身问题,还是说应该微调的问题。 本文将针对这个困惑给予一些建议,希望对你有帮助。

以智能客服场景为例,我们列举如下几个需要进行微调的关键因素:

什么时候需要结合微调进一步增强 RAG 能力?

因素 原因
领域特定性 如果客服需要处理的问题非常专业或者特定于某个行业,那么单纯的RAG(Retrieval-Augmented Generation)加上通用大模型可能不足以提供精确的答案。在这种情况下,微调模型以包含特定领域的数据和术语,可以显著提高客服的准确性和效率。
法律和合规性 在某些行业,如金融或医疗,客服需要严格遵守特定的法规和标准。微调模型以确保所有回答都符合这些要求是至关重要的。
个性化服务 如果企业希望提供高度个性化的客户服务,例如根据用户的购买历史、偏好和行为来定制回答,那么微调模型以包含这些个性化数据是必要的。
文化和语言差异 不同地区和文化背景的用户可能有不同的沟通方式和表达习惯。如果客服需要服务于多语言或多文化的用户,微调模型以适应这些差异可以提供更好的用户体验。
性能和资源 微调模型通常需要额外的计算资源和时间。如果企业有足够的资源来支持微调,并且期望通过微调获得显著的性能和准确度的提升,那么这是一个值得考虑的选项。
持续学习和适应 如果客服系统需要不断适应新的数据和用户行为,那么微调可以是一个持续的过程,而不是一次性的事件。

总的来说,当智能客服需要处理的是非常通用、非特定领域的任务,并且不需要深入理解上下文或个性化服务时,RAG加上通用大模型可能就足够了。然而,一旦涉及到特定领域知识、个性化服务、文化差异、法规合规性或者需要持续学习和适应,微调模型就变得非常必要,以确保智能客服能够提供高质量的服务并满足用户的期望。

微调与 RAG 如何选?

因素 方案 原因
动态数据 RAG 数据如果更新较频繁,需要选择 RAG,因为高频率的更新,微调成本高
模型能力定制
个性化服务
微调 如希望提供高度个性化的客户服务,如聊天风格或者根据用户的购买历史、偏好和行为来定制回答,那么微调模型以包含这些个性化数据是必要的。
幻觉 RAG > 微调 都能解决,但是 RAG 效果好于微调
可解释性 RAG 微调是黑盒的,出了问题我们很难追溯到,为什么某一个单词生成了
成本 RAG 不用说了,微调成本肯定高于 RAG
依赖通用能力 RAG 如果微调,会导致影响原模型权重进而可能影响原模型能力的降低,即“模型的遗忘”,而 RAG 不会。
延迟 微调 RAG 包含很多工作流,比较耗费时间,如果要求低延迟,微调首选
智能设备 微调 由于硬件本身能力的限制,所以不得不使用小模型,使得其在某一方面的厂进行能力更强。

学习更多关于 AI 大模型全栈知识👇

:::danger 🌈** AI大模型全栈通识课程**👇

:::

:::color1 🙋 个人介绍 **👉🏻**

:::

:::color5 🙋 AI 工具 **👉🏻**

:::

:::info 🙋 开源版知识库**👉🏻**

:::

:::warning 🙋 AI全栈通识课堂

:::


免责声明

素材来源于网络以及个人总结,仅供个人学习交流无商业用途,版本归原创者所有

如有侵权请及时与我联系(微信:AGI舰长-LHYYH0001)删除