贝叶斯平滑要解决的问题:商品的历史点击率不能代表真实情况。
例如:

  1. 历史中商品只出现一次,且被点击了,并不能代表它的点击率就是1.
  2. 历史中商品没有出现,也不能代表点击率为0。

贝叶斯平滑理论

贝叶斯平滑的核心思想是:假设商品的点击率不仅与观测到的点击率,还与隐含的点击率有关;且假设观测到的点击率服从伯努利分布,隐含的点击率服从Beta分布。其中,Binomail分布和Beta分布互为共轭分布,因此若Binomail分为似然函数,Beta分布为先验分布,则后验分布仍然为Beta分布。如下图1所示,贝叶斯平滑的概率图。
10.PNG
图1 贝叶斯平滑概率图

公式推导

贝叶斯平滑 - 图2 (1)
对其取log,且求导可得
贝叶斯平滑 - 图3(2)
贝叶斯平滑 - 图4(3)
令求导后的结果为0,即可得到最优的贝叶斯平滑 - 图5贝叶斯平滑 - 图6
贝叶斯平滑后的点击率,如下公式(4)所示。
贝叶斯平滑 - 图7 (4)

参数估计

后验Beta分布的参数估计可以采取矩估计和Fixed-point iteration。

矩估计

对于Beta分布的矩估计是根据均值和方差进行参数估计,如下式(5)和(6)所示,参数的估计公式。
贝叶斯平滑 - 图8 (5)
贝叶斯平滑 - 图9 (6)

Fixed-point iteration

该方式对参数进行估计的步骤如下:

  1. 首先给出参数的初始值。
  2. 在初始值处,构造一个似然函数的下界函数。求得该下届函数的最大值的闭式解,带入到下次迭代。
  3. 不断重复上述1,2步骤,直至收敛。

该方式类似于EM算法的核心思想。

参考文献

  1. 伯努利分布、二项分布、Beta分布、多项分布和Dirichlet分布与他们之间的关系,以及在LDA中的应用【存疑】
  2. 如何通俗理解 beta 分布?
  3. CTR预估中的贝叶斯平滑方法(一)原理及实验介绍
  4. CTR预估中的贝叶斯平滑方法(二)
  5. 广告点击率的贝叶斯平滑
  6. CTR,CVR预估中的丝滑操作,上分知识点整理!
  7. 贝叶斯平滑