学习更多关于 AI 大模型全栈知识👇

:::color1 🎯 当下，企业在做垂直应用方案落地时，会在 “RAG+**通用大模型” 以及“RAG+微调**大模型” 上难以抉择。有人认为，基于“通用”大模型的RAG 知识库方案就能实现业务场景。而有时会发现，仍然无法满足预期要求，而到底什么时候才应该选择微调，而不是优化我的 RAG 方案？这个界限如何找？

:::

“通用”大模型：指的没有做过微调的大模型，比如大家熟知的 gpt-4、Qwen、Baichuan、Llama 等等。

的确，这个界限很难找，因为你也不知道，是目前你的 RAG 方案本身问题，还是说应该微调的问题。本文将针对这个困惑给予一些建议，希望对你有帮助。

以智能客服场景为例，我们列举如下几个需要进行微调的关键因素：

什么时候需要结合微调进一步增强 RAG 能力？

因素	原因
领域特定性	如果客服需要处理的问题非常专业或者特定于某个行业，那么单纯的RAG（Retrieval-Augmented Generation）加上通用大模型可能不足以提供精确的答案。在这种情况下，微调模型以包含特定领域的数据和术语，可以显著提高客服的准确性和效率。
法律和合规性	在某些行业，如金融或医疗，客服需要严格遵守特定的法规和标准。微调模型以确保所有回答都符合这些要求是至关重要的。
个性化服务	如果企业希望提供高度个性化的客户服务，例如根据用户的购买历史、偏好和行为来定制回答，那么微调模型以包含这些个性化数据是必要的。
文化和语言差异	不同地区和文化背景的用户可能有不同的沟通方式和表达习惯。如果客服需要服务于多语言或多文化的用户，微调模型以适应这些差异可以提供更好的用户体验。
性能和资源	微调模型通常需要额外的计算资源和时间。如果企业有足够的资源来支持微调，并且期望通过微调获得显著的性能和准确度的提升，那么这是一个值得考虑的选项。
持续学习和适应	如果客服系统需要不断适应新的数据和用户行为，那么微调可以是一个持续的过程，而不是一次性的事件。

总的来说，当智能客服需要处理的是非常通用、非特定领域的任务，并且不需要深入理解上下文或个性化服务时，RAG加上通用大模型可能就足够了。然而，一旦涉及到特定领域知识、个性化服务、文化差异、法规合规性或者需要持续学习和适应，微调模型就变得非常必要，以确保智能客服能够提供高质量的服务并满足用户的期望。

微调与 RAG 如何选？

因素	方案	原因
动态数据	RAG	数据如果更新较频繁，需要选择 RAG，因为高频率的更新，微调成本高
模型能力定制个性化服务	微调	如希望提供高度个性化的客户服务，如聊天风格或者根据用户的购买历史、偏好和行为来定制回答，那么微调模型以包含这些个性化数据是必要的。
幻觉	RAG > 微调	都能解决，但是 RAG 效果好于微调
可解释性	RAG	微调是黑盒的，出了问题我们很难追溯到，为什么某一个单词生成了
成本	RAG	不用说了，微调成本肯定高于 RAG
依赖通用能力	RAG	如果微调，会导致影响原模型权重进而可能影响原模型能力的降低，即“模型的遗忘”，而 RAG 不会。
延迟	微调	RAG 包含很多工作流，比较耗费时间，如果要求低延迟，微调首选
智能设备	微调	由于硬件本身能力的限制，所以不得不使用小模型，使得其在某一方面的厂进行能力更强。

学习更多关于 AI 大模型全栈知识👇

:::danger 🌈** AI大模型全栈通识课程**👇

:::

:::color1 🙋 个人介绍 **👉🏻**

:::

:::color5 🙋 AI 工具 **👉🏻**

:::

:::info 🙋 开源版知识库**👉🏻**

:::

:::warning 🙋 AI全栈通识课堂

:::

✅免责声明

素材来源于网络以及个人总结，仅供个人学习交流无商业用途，版本归原创者所有

如有侵权请及时与我联系（微信：AGI舰长-LHYYH0001）删除

AI全栈「AGI」专栏

👍 RAG or RAG+微调？

学习更多关于 AI 大模型全栈知识👇