1.研究目的
- 多分类的状态和两分类的结果之间关联性,即2xC的表格
案例中的研究对象,按照吸烟状态分为三组。对他们进行长期随访,收集研究对象发生阿尔兹海默症的事件信息。
2.数据形式要求
3.需要满足的假设
观测的结果变量是二分类变量(观察)
- 状态分组是一个多分类分组(>2个)(观察)
- 具有相互独立的观测值,不存在相互干扰作用(观察)
- 样本量足够大,最小的样本量要求为分析中的任一单元格期望频数大于5(需要检验)
当出现某个单元格频数小于5时,需进行进行Fisher精确检验
4.对假设的检验方式
对于样本量的检验方式与2x2卡方检验相同
- 结果中最小期望频数为23.2,没有期望频数小于5的单元格,故可以进行2xC卡方检验;
如果当出现某个单元格频数小于5时,需进行进行Fisher精确检验;
5.操作方法
5.1 2xC卡方检验
分析-描述统计-交叉表
统计选项卡
单元格选项卡
5.2 两两比较
分析-描述统计-交叉表
6.结果及解释
6.1 描述统计结果
结果中从不吸烟的47位研究对象中有15人发生阿尔兹海默症(31.9%),曾经吸烟的51位研究对象中有29人发生阿尔兹海默症(56.9%),而持续吸烟的52位研究对象中有30人发生阿尔兹海默症,占比(57.7%);
6.2 假设检验结果
:::warning
2xC卡方检验H0:多分类的状态和两分类的结果之间的比例没有显著差异; :::
卡方检验结果显示 ,P = 0.016<0.05,拒绝H0假设。提示从不吸烟、曾经吸烟和持续吸烟者发生阿尔兹海默症的风险不全相等。即至少有两组人群发生阿尔兹海默症的风险差异有统计学意义。如果要知道到底是那两组之间不同,还需要两两比较。
6.3 两两比较结果
:::warning 只有在交叉表中进行两两比较时,需要注意行和列的字段。必须状态字段放在列中,结果字段放在行中
:::特别注意:在两两比较中,一定要注意状态和分组的行列关系。由于研究目的是研究不同状态下的结果。故需要按照状态进行分组,所以状态需要放在列标题上。同时需要注意,两两比较结果的备注中是对哪个分类子集的比较;
- 结果输出通过脚标(a,b,c等)标记了两两比较的结果。标记后,每种状态的标记(上下两行的脚标)一定相同,不同状态相对应的结果发生情况的标记(左右三列的脚标)可能相同,也可能不同。
- 字母标记的意思是:如果两组之间标记字母相同,说明这两组之间的差异无统计学意义;如果两组标记字母不同,说明这两组之间的差异有统计学意义;
根据此原则,能得到如下结论:
150名研究对象,按照吸烟状态分为三组并进行长期随访,从不吸烟的47位研究对象中有15人发生阿尔兹海默症(31.9%),曾经吸烟的51位研究对象中有29人发生阿尔兹海默症(56.9%),而持续吸烟的52位研究对象中有30人发生阿尔兹海默症(57.7%)三组差异具有统计学意义(χ2=8.315,P=0.016);
- 通过两两比较发现,从不吸烟者与曾经吸烟者、持续吸烟者发生阿尔兹海默症的风险差异存在统计学意义(P<0.05),而曾经吸烟者与持续吸烟者发生阿尔兹海默症的风险没有差异。