损失函数用交叉熵替换:相对熵:用来衡量俩个概率分布(预测分布,真实分布)之间的差异相对熵=交叉熵-熵定义:用来衡量在给定的真实分布下,使用非真实分布消除不确定性所需要付出努力的大小消除不确定性: 预测与真实的误差真实分布[0,0,1,0]唯一的那一项对应预测分布那一项的信息量,概率越接近与1,信息量越确定 损失函数用交叉熵替换: 相对熵:用来衡量俩个概率分布(预测分布,真实分布)之间的差异 相对熵=交叉熵-熵