本文大纲 2.3  统计学模型—贝叶斯模型 - 图1

1. 什么是贝叶斯模型?

先验概率:P(A)

每次先验实验的概率是一样的,比如抛硬币,获得每面的概率都是1/2

条件概率:P(A|B)

指事件A在事件B发生的条件下发生的概率,公式为
2.3  统计学模型—贝叶斯模型 - 图2

后验概率:P(A|B)

在已知条件的前提下,先设定一个假设,然后通过先验实验来更新这个概率,公式为
2.3  统计学模型—贝叶斯模型 - 图3

贝叶斯与全概率

假设有三个小偷A1、A2、A3,店被偷的事件记为B,且A、A、A互斥,

  • 店铺被偷的概率是多少?

    1 = P(A|B)+P(A|B)+P(A|B) ——A、A、A互斥,3个小偷偷店铺的概率之和是1
    P(B) = P(AB)+P(AB)+P(AB) ——店铺被偷的概率,两边乘以P(B)
    = P(A)P(B|A) + P(A)P(B|A)+ P(A)P(B|A) ——按条件概率公式展开
    = 2.3  统计学模型—贝叶斯模型 - 图4 ——全概率公式(知道原因求结果)

  • 店已被偷,是A偷的概率是多少?

2.3  统计学模型—贝叶斯模型 - 图5 ——根据条件概率计算店已被偷是A的概率
= 2.3  统计学模型—贝叶斯模型 - 图6 ——带入条件概率公式和全概率公式,得到贝叶斯公式


案例

全概率模型案例

image.png
设购房为B,不购房为B,年龄30~40岁为事件A,性别女为事件A,年收入25万以上为A,未婚为A。
则最终要求的是P(B),根据全概率公式得
P(B)=P(A)P(B|A)+P(A)P(B|A)+P(A3)P(B|A3)+P(A4)P(B|A4)
其中,
P(A) = 3/8 ——年龄30~40岁
P(A) = 3/8 —— 性别女
P(A) = 4/8 —— 年收入25万以上
P(A) = 5/8 —— 未婚

P(B|A)=1/3 ——年龄30~40岁且买房
P(B|A) = 1/3 —— 性别女且买房
P(B|A) = 3/4 —— 年收入25万以上且买房
P(B|A) = 1/5 —— 未婚且买房

则P(B)=P(A)P(B|A)+P(A)P(B|A)+P(A3)P(B|A3)+P(A4)P(B|A4)
=3/81/3+3/81/3+4/83/4+5/81/5
=3/4


贝叶斯模型案例

image.png

2. 怎么应用贝叶斯思想?

关注先验条件
按照贝叶斯定律,很明显我们忽略了导致这个结果的前提条件。这个前提条件的忽略最终可能影响了我们对整件事情的判断,也就是影响后验概率。

对于事件发生的概率时,要去思考是否有其影响因素,而这些影响因素往往就是”先验条件”。

比如做一次渠道投放,目标人群是20-30岁。最终评估活动效果时,不能只看获得目标人群数的占比,而要先考虑投放渠道的不同,这是投放的影响因素,是先验条件。