1. 概念
1. 卡方检验
卡方检验通常用在判断某个变量(或特征)值和因变量是否有显著关系。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。通常卡方值越大,p-value值越小,越显著拒绝原假设。
2. p-value
p-value的含义为:样本点的差异是由抽样误差所致的概率(假设当前差异对结果没影响的概率)。小于0.05(5%)表示有统计学差异,小于0.01(1%)表示有显著统计学差异。
更新: p-value含义:在
为真的情况下,得到当前样本集的概率 更具体参考:https://www.zhihu.com/question/23149768
2. 示例
以四格卡方为例,判断喝牛奶对感冒是否会产生影响。
:假设喝牛奶对感冒无影响
则感冒的实际概率为:
此时四格表的理论值应为:
- 卡方值:
- 自由度为:
- p-value:
接受假设,感冒与喝牛奶无关。