注意力分布

给定任务相关的查询量注意力机制 - 图1,注意力变量注意力机制 - 图2来表示被选择信息的索引位置,即注意力机制 - 图3表示选择了第注意力机制 - 图4个输入向量,为了方便,我们采用一种软性信息选择机制,给定注意力机制 - 图5注意力机制 - 图6的情况下,选择第注意力机制 - 图7个输入向量的概率注意力机制 - 图8
注意力机制 - 图9
注意力机制 - 图10为注意力打分函数,有几种形式:

  • 加性模型注意力机制 - 图11
  • 点积模型注意力机制 - 图12
  • 缩放点积模型注意力机制 - 图13
  • 双线性模型注意力机制 - 图14

    加权平均

    注意力机制 - 图15