21.11.17 SJL博客3篇

浏览 364 扫码分享 2023-03-22 13:51:03

Seq2Seq中Exposure Bias现象的浅析与对策
在Decoder Input里替换输入，相当于就是破坏了Teacher-forcing，要求对Decoder-input鲁棒

突破瓶颈，打造更强大的Transformer
Transformer表达能力的重点在于KeySize，有效的增大KeySize

如何应对Seq2Seq中的“根本停不下来”问题？
停不下来可能是因为采样空间里的eos的概率太小了，用一些手段来保证模型会采样到eos可以缓解这个问题

若有收获，就点个赞吧

上一篇:

下一篇:

让时间为你证明

展开/收起文章目录