使用softmax去得到一个概率分布:计算时存在数值上溢和下溢的可能。 而 logsumexp 可以很好地解决这个问题:通常 c 取值为 , 这样的话指数项不会上溢,且分母中至少有一项为1,也不会出现 nan 。