Li等人,(2023)(opens in a new tab)提出了一种新的提示技术,以更好地指导LLM生成所需的摘要。
    训练了一个可调节的策略LM来生成刺激/提示。越来越多地使用RL来优化LLM。
    下图显示了方向性刺激提示与标准提示的比较。策略LM可以很小,并且可以优化以生成指导黑盒冻结LLM的提示。
    2.8 方向性刺激提示 - 图1
    图片来源:Li等人,(2023)(opens in a new tab)
    完整示例即将推出!