最大熵模型指出,在预测一个样本或者一个事件的概率分布时,首先应当满足所有的约束条件,进而对未知的情况不做任何的主观假设。在这种情况下,概率分布最均匀,预测的风险最小,因此得到的概率分布的熵是最大。
    使用最大熵模型进行学习的目的就是为了找到一个最优的模型
    最大熵模型: - 图1
    我们的目标就是使得H(P)最大,所以要求出此时对应的P(y,x)
    原理就是