什么是 CFG

Classifier-free guidance CFG scale——CGF指数。用来调节文本提示对扩散过程的引导程度。数值较高时会向你的提示进行另类生成。Stable Diffusion 提示词相关性 CFG 总的来说是一项强大的自然语言处理技术,可以帮助人们更好地理解文本的结构和语法规则。可以应用于很多领域,如机器翻译、信息抽取、问答系统等等。

取值范围

CFG 的取值范围在 0 ~ 30 之间,我们通过不同数值的 CFG 生成图画对比:

CFG 提示词相关性的设置 - 图1

  • 低 CFG时:画面比较灰暗,色彩对比度较弱,构图较差,画面未定型。
  • 高CFG 时:画面对比过强,色彩非常饱和,甚至过饱和,颜色和结构失调。
  • 过低和过高都不利于画面生成,建议取值在 7 ~ 12 之间,或者扩大一些 4 ~ 15 之间,一般设置为 8 即可。

CFG & Steps

大部分采样方式中,采样步数(Sampling Step)的增加能够对冲高 CFG 带来的坏处,甚至在特定情况下能有很好的辅助效果。可以参考文章中的总结图,CFG 的选择并不是一个固定值: CFG 提示词相关性的设置 - 图2 可以通过对比图直观感受以下,CFG 和 Steps 的互相影响: CFG 提示词相关性的设置 - 图3

参考文章

[Stable Diffusion 疑难杂症] CFG、采样方式、高清修复、ControlNet