1.研究目的

两组相互独立的样本所代表总体之间的均数是否有差异

本案例为:在本次考试中,男性和女性的成绩是否有差异

2.数据形式要求

一般为两列数据,一列作为分类字段标记两个独立样本,一列统计相关连续性数据的值
image.png

3.需要满足的假设

  1. 观测变量为连续变量(观察)
  2. 观测变量可分为2组(观察)
  3. 观测值之间相互独立,不存在相互干扰(观察)
  4. 观测变量各组内不存在显著的异常值(需要检验)
  5. 观测变量在各组内接近正态分布(需要检验)
  6. 两组的观测变量的方差相等(需要检验)

    4.对假设的检验方式

    4.1 对显著异常值的检验和正态性的检验

    分析-描述统计-探索

    image.png
    image.png

    异常值检验结果

    image.png

  7. 通过箱线图可以看出,在不同性别内没有显著的异常值;

    正态性检验结果

    image.png :::info Shapiro-Wilk检验的H0:被检验数据的分布类型与正态分布之间没有显著差别; :::

  8. 通过对两组的Shapiro-Wilk检验结果看,两组都符合正态性。

    4.2 方差齐性的检验

    样本方差在探索中有计算结果,但方差同质性的检验结果会在独立样本T检验结果中阐述

    样本方3差情况描述

    分析-描述统计-探索
    image.png

  9. 从样本方差情况看男性的样本方差为19.029,女性为32.414,样本差距较大。但样本所代表的总体方差是否有如此大的差距还需要进行Levene’s Test

    样本方差的Levene’s Test

    Levene’s Test的结果在独立样本T检验结果中进行阐述
    image.png :::info

  10. Levene’s检验H0:两组数据之间方差之间没有显著性差异(方差相等) :::

  11. Levene’s检验结果显示,F=1.484,P=0.231>0.05,接受原假设。提示两组数据方差齐。

    5.操作方法

    分析-比较均值-独立样本T检验

    在做独立样本T检验的时候,需要标注分组
    image.png

    6 结果及解释

    6.1 描述性统计结果

    image.png

  12. 男女各样本量是20。男生成绩平均值为89.942,标准差为4.3622。女生成绩平均值为83.798,标准差为5.6933;

    6.2 假设检验结果

    image.png :::info

  13. 独立样本T检验H0:两组独立样本所代表的总体间的平均数没有显著差别 :::

  14. 男生和女生成绩的差值为6.1440,95%置信区间为2.8973到9.3907

  15. 从检验结果看,男生和女生考试成绩存在统计学差异,男生平均成绩高于女生;

    特别注意

    1. 若此时方差不相等,但在差距较小的前提下可以直接使用方差不相等的结果(t’检验)。或者直接放弃T检验方式,使用非参数Mann-Whitney U检验方式;
    2. 剔除异常数值或进行代数变换

6.3 结论

  1. 本研究采用独立样本t检验判断某班级男生和女生考试成绩的差异。研究数据不存在显著异常值,且在各组内接近正态分布,同时方差齐;
  2. 结果显示,男生考试成绩(89.942 ± 4.362)高于女生(83.798 ± 5.693),差值为6.144(95%置信区间为2.897-9.391)
  3. 独立样本t检验结果提示,t= 3.831,P<0.001,说明男生和女生考试成绩存在统计学差异,男生平均成绩高于女生