概念:卡方分析(交叉表分析、列联表分析),具体为 Pearson 卡方。
目的:检验两个定性变量是否存在相关性。
举例:性别 和 是否抽烟 之间是否存在关系?
首先,判断 P 值是否呈现显著性,呈现显著性说明可能存在显著性差异。具体差异可以通过选择百分比进行对比判断。
- 1、背景
想研究性别和是否抽烟之间有没有关系,男性抽烟的比例有没有更高等。 - 2、理论
性别和是否抽烟的关系,这一句话里面包含两个词语,分别是:性别,是否抽烟。性别为X,是否抽烟为Y。性别为定类数据,是否抽烟也是定类数据。因而使用卡方分析进行研究。 - 3、操作
性别和是否抽烟的关系,性别为X,是否抽烟为Y,对应放置。如下图:
题目 | 名称 | 性别 | 总计 | X² | p | |
---|---|---|---|---|---|---|
男 | 女 | |||||
是否吸烟 | 吸烟 | 51(65.4) | 27(45.0) | 78(56.5) | 5.734 | 0.017* |
不吸烟 | 27(34.6) | 33(55.0) | 60(43.5) | |||
总计 | 78 | 60 | 138 | |||
p <0.05 * p<0.01 |
从上表格可以看出,研究性别和是否吸烟之间的关系,由于性别和是否吸烟这两项均为定类数据,因而使用卡方分析进行研究。从上表可知,不同性别群体吸烟情况呈现出显著性差异(X2=5.734,P=0.017 <0.05),具体通过对比百分比差异可知,男性群体中有65.4%吸烟(明显高于平均水平56.5%),但是女性群体中45%会吸烟。说明男性群体抽烟的比例明显的高于女性群体。