概念:卡方分析(交叉表分析、列联表分析),具体为 Pearson 卡方。
    目的:检验两个定性变量是否存在相关性。
    举例:性别 和 是否抽烟 之间是否存在关系?

    首先,判断 P 值是否呈现显著性,呈现显著性说明可能存在显著性差异。具体差异可以通过选择百分比进行对比判断。

    • 1、背景
      想研究性别和是否抽烟之间有没有关系,男性抽烟的比例有没有更高等。
    • 2、理论
      性别和是否抽烟的关系,这一句话里面包含两个词语,分别是:性别,是否抽烟。性别为X,是否抽烟为Y。性别为定类数据,是否抽烟也是定类数据。因而使用卡方分析进行研究。
    • 3、操作
      性别和是否抽烟的关系,性别为X,是否抽烟为Y,对应放置。如下图:
    题目 名称 性别 总计 p
    是否吸烟 吸烟 51(65.4) 27(45.0) 78(56.5) 5.734 0.017*
    不吸烟 27(34.6) 33(55.0) 60(43.5)
    总计 78 60 138
    p <0.05 * p<0.01

    从上表格可以看出,研究性别和是否吸烟之间的关系,由于性别和是否吸烟这两项均为定类数据,因而使用卡方分析进行研究。从上表可知,不同性别群体吸烟情况呈现出显著性差异(X2=5.734,P=0.017 <0.05),具体通过对比百分比差异可知,男性群体中有65.4%吸烟(明显高于平均水平56.5%),但是女性群体中45%会吸烟。说明男性群体抽烟的比例明显的高于女性群体。