版本 更新内容 时间 操作人
V1 主要更新了一个AB案例的代码实现 2020-9-25 呆呆

:::info 主要基于了一个数据集,进行了转化率的有效性检验。

对于理论可解释方面还需要进一步学习。 :::

数据集:
audience_expansion.zip
代码:
AB测试2.ipynb

该数据集:从支付宝中的两个营销活动中收集的真实数据集。
该数据集在支付宝中包含两个商业定向广告系列日志。

数据集包括三张表,但是本文仅用到一张A/B测试数据集 effect_tb.csv,4个字段如下:

  • 事件:该次营销进行了两天
  • 支付宝用户ID:有部分重复用户
  • 用户行为:用户在当天是否产生点击活动(0:未点击,1:点击)
  • 营销策略编号:营销策略编号(1:对照组;2:营销策略一;3:营销策略二)

主要用到后3个字段。

1 数据处理

image.png

2 数据容量

  1. #以对照组点击率作为基准线
  2. df_effect[df_effect['dmp_id'] == 1]['label'].mean()

0.012551019015964006
如果希望点击率至少翻一倍,即增加1.26%,则需要的样本量为1398
image.png

策略一提升0.2个百分点,策略二提升1.3个百分点,只有策略二满足了前面对点击率提升最小值的要求。 需要进行假设检验,看策略二点击率的提升是否显著。
a. 原假设和备择假设
记对照组点击率为p1,策略二点击率为p2,则:
原假设 H0: p1 ≥ p2
备择假设 H1: p1 < p2
b. 分布类型、检验类型和显著性水平
样本服从二点分布,独立双样本,样本大小n>30,总体均值和标准差未知,所以采用Z检验。显著性水平α取0.05。

3 假设检验

image.png

image.png

Z检验和T检验的结果显示,策略1和策略2都表现为显著。

参考文章:
链接:https://zhuanlan.zhihu.com/p/166274462
链接: https://zhuanlan.zhihu.com/p/170474460

T检验、F检验、卡方检验详细分析及应用场景总结 - 旧梦的文章 - 知乎 https://zhuanlan.zhihu.com/p/124072225
A/B测试详细分析及应用场景总结 - 旧梦的文章 - 知乎 https://zhuanlan.zhihu.com/p/124857702
卡方:https://zhuanlan.zhihu.com/p/128905132