2022-07-07-Seq2Seq文本生成 - 2022-07-08-注意力机制介绍 - 《技术笔记》

近年来，受人类选择性视觉注意力的启发，注意力机制（Attention Mechanism）被广泛应用于自然语言处理的各种任务中，它旨在从大量的信息中选择出对当前目标任务更为关键和有效的信息。
Attention机制可分为如下三类：软性注意力（Soft Attention）、硬性注意力（Hard Attention）和自注意力（Self Attention）。软性注意力是对所有的数据进行关注，计算出相应的注意力权值，且不设置任何筛选条件。硬性注意力会在生成注意力权重后，筛选掉一部分不符合条件的注意力，即不再注意这些不符合条件的部分。自注意力是指句子内部元素之间发生的相互关注的机制。它可以“动态”地生成任意两个单词间不同的连接权重，大大缩短词之间的距离，更易于捕获序列之间的长距离依赖关系。
Attention机制的具体计算过程可以抽象为三个阶段，如图2.6所示。