1. KL散度

KL散度,JS散度和交叉熵 - 图1散度又称KL散度,JS散度和交叉熵 - 图2距离,相对熵,公式为
KL散度,JS散度和交叉熵 - 图3
KL散度,JS散度和交叉熵 - 图4KL散度,JS散度和交叉熵 - 图5相似度越高,KL散度,JS散度和交叉熵 - 图6散度越小。
两个性质:
1)不对称性 KL散度,JS散度和交叉熵 - 图7
2)非负性

2. JS散度

KL散度,JS散度和交叉熵 - 图8散度也称KL散度,JS散度和交叉熵 - 图9距离,是KL散度,JS散度和交叉熵 - 图10散度的一种变形。
KL散度,JS散度和交叉熵 - 图11
但是不同于KL主要又两方面:
(1)值域范围
KL散度,JS散度和交叉熵 - 图12散度的值域范围是KL散度,JS散度和交叉熵 - 图13,相同则是KL散度,JS散度和交叉熵 - 图14,相反为KL散度,JS散度和交叉熵 - 图15。相较于KL散度,JS散度和交叉熵 - 图16,对相似度的判别更确切了。
(2)对称性,即KL散度,JS散度和交叉熵 - 图17,从数学表达式中就可以看出。

3. 交叉熵

在神经网络中,交叉熵可以作为损失函数,因为它可以衡量KL散度,JS散度和交叉熵 - 图18KL散度,JS散度和交叉熵 - 图19的相似性。
KL散度,JS散度和交叉熵 - 图20
KL散度,JS散度和交叉熵 - 图21
交叉熵和相对熵的关系:相对熵=交叉熵-信息熵KL散度,JS散度和交叉熵 - 图22KL散度,JS散度和交叉熵 - 图23代表真实分布,KL散度,JS散度和交叉熵 - 图24代表估计分布

https://blog.csdn.net/witnessai1/article/details/79574812 https://blog.csdn.net/ningyanggege/article/details/87906786 https://zhuanlan.zhihu.com/p/74075915