随意:跟随意愿,主观的做某事根据query查询我想要的东西 (xi,yi)代表(key,value)K可以看作衡量某一个x与各xi之间距离的一个函数,距离越近K()越大,距离越远K()越小 演变向softmax 带可学习参数w的注意力机制 w对应是高斯核的宽度,即学习取多宽的核来找重要的东西。