1. 贪心算法:每次直接选择最高的概率
    2. Beamsearch:每一步会保留BeamSize大小的选项,然后对全部分支用概率筛选剩下Beamsize
    3. 随机采样:贪心算法的修改,每一次不是选择最高概率,而是依概率随机选择,虽然大概率还是选择了比较大概率的位置,但是也有一定的机会选择到稍微小概率的词,增加了生成的多样性
    4. TopK:随机采样的修改,不在全部词表上依概率选择,而是只会保留最高概率的K个词,重新归一化之后再按照概率进行随机选择
    5. Nuclear:即便Topk看起来已经不错了,但是如果模型的概率分布过于分散,效果就会不好(丢失了一些比较优质的词。Nuclear是Topk采样的升级版本,他不按照概率选择固定大小的子词表,而是保留最小的集合,使得这个集合的概率和大于一个阈值,然后再归一化,随机选择。