transformer的注意力机制

浏览 129 扫码分享 2023-11-22 12:57:20

自注意力输入输出张量维度都是(句子个数, sentence_length, enbedding_dim)
获得张量体现的是每个字跟自己关系大小，自注意力机制体现的对角线是对自己的关系，往往高亮
自注意力是个系数矩阵在transformer中起到增强高相关度的字的权重的作用

若有收获，就点个赞吧

上一篇:

下一篇:

让时间为你证明

展开/收起文章目录