1.研究目的

  1. 多分类的状态和两分类的结果之间关联性,即2xC的表格
  2. 案例中的研究对象,按照吸烟状态分为三组。对他们进行长期随访,收集研究对象发生阿尔兹海默症的事件信息。

    2.数据形式要求

    卡方检验(2xC) - 图2

    3.需要满足的假设

  3. 观测的结果变量是二分类变量(观察)

  4. 状态分组是一个多分类分组(>2个)(观察)
  5. 具有相互独立的观测值,不存在相互干扰作用(观察)
  6. 样本量足够大,最小的样本量要求为分析中的任一单元格期望频数大于5(需要检验)

    当出现某个单元格频数小于5时,需进行进行Fisher精确检验

4.对假设的检验方式

对于样本量的检验方式与2x2卡方检验相同
卡方检验(2xC) - 图3

  1. 结果中最小期望频数为23.2,没有期望频数小于5的单元格,故可以进行2xC卡方检验;

    如果当出现某个单元格频数小于5时,需进行进行Fisher精确检验;

5.操作方法

5.1 2xC卡方检验

分析-描述统计-交叉表

卡方检验(2xC) - 图4

统计选项卡

卡方检验(2xC) - 图5

单元格选项卡

卡方检验(2xC) - 图6

5.2 两两比较

分析-描述统计-交叉表

卡方检验(2xC) - 图7

卡方检验(2xC) - 图8

6.结果及解释

6.1 描述统计结果

卡方检验(2xC) - 图9

  1. 结果中从不吸烟的47位研究对象中有15人发生阿尔兹海默症(31.9%),曾经吸烟的51位研究对象中有29人发生阿尔兹海默症(56.9%),而持续吸烟的52位研究对象中有30人发生阿尔兹海默症,占比(57.7%);

    6.2 假设检验结果

    卡方检验(2xC) - 图10 :::warning

  2. 2xC卡方检验H0:多分类的状态和两分类的结果之间的比例没有显著差异; :::

  3. 卡方检验结果显示 ,P = 0.016<0.05,拒绝H0假设。提示从不吸烟、曾经吸烟和持续吸烟者发生阿尔兹海默症的风险不全相等。即至少有两组人群发生阿尔兹海默症的风险差异有统计学意义。如果要知道到底是那两组之间不同,还需要两两比较。

    6.3 两两比较结果

    :::warning 只有在交叉表中进行两两比较时,需要注意行和列的字段。必须状态字段放在列中,结果字段放在行中
    卡方检验(2xC) - 图11 ::: 卡方检验(2xC) - 图12

  4. 特别注意:在两两比较中,一定要注意状态和分组的行列关系。由于研究目的是研究不同状态下的结果。故需要按照状态进行分组,所以状态需要放在列标题上。同时需要注意,两两比较结果的备注中是对哪个分类子集的比较;

  5. 结果输出通过脚标(a,b,c等)标记了两两比较的结果。标记后,每种状态的标记(上下两行的脚标)一定相同,不同状态相对应的结果发生情况的标记(左右三列的脚标)可能相同,也可能不同。
  6. 字母标记的意思是:如果两组之间标记字母相同,说明这两组之间的差异无统计学意义;如果两组标记字母不同,说明这两组之间的差异有统计学意义;
  7. 根据此原则,能得到如下结论:

    1. 从不吸烟者(a)与曾经吸烟者(b)发生阿尔兹海默症的风险差异存在统计学意义(P<0.05);
    2. 从不吸烟者(a)与吸持续烟者(b) 发生阿尔兹海默症的风险差异存在统计学意义(P<0.05);
    3. 曾经吸烟者(b)与持续吸烟者(b) 发生阿尔兹海默症的风险没有差异。

      6.4 结论

  8. 150名研究对象,按照吸烟状态分为三组并进行长期随访,从不吸烟的47位研究对象中有15人发生阿尔兹海默症(31.9%),曾经吸烟的51位研究对象中有29人发生阿尔兹海默症(56.9%),而持续吸烟的52位研究对象中有30人发生阿尔兹海默症(57.7%)三组差异具有统计学意义(χ2=8.315,P=0.016);

  9. 通过两两比较发现,从不吸烟者与曾经吸烟者、持续吸烟者发生阿尔兹海默症的风险差异存在统计学意义(P<0.05),而曾经吸烟者与持续吸烟者发生阿尔兹海默症的风险没有差异。