Greedy

贪心的,每一次选择最好的
对应的在文本生成里就是一直选择可能性最大的
也就是Decode的时候选择概率最大的词,然后循环预测

Beam

维护一个树状的搜索区域
每一次的输出里选择K个结果加入候选
对K个候选都输入模型计算下一个,然后计算累乘概率(考虑的是序列的评分),然后在K^2个中选择K个
和上面的穷举而言有了一定的改进,考虑的更远
同时在选择的时候又有做剪枝,减小复杂度

Search strategy - 图1