点击查看【bilibili】

1. 偏相关的适用情况

当我们想控制第三个变量(控制变量)的影响,看自变量和因变量之间更纯粹的关系时,则需要用到偏相关。
image.png
image.png
自变量、因变量和控制变量均为数值型变量

  • 例如控制住智商,看学习时长与学习成绩之间的关系
  • 例如控制住性别,看身高与收入之间的关系

    2. 偏相关的计算

  1. 计算偏相关系数rxy.z

image.png

  1. 计算自由度df=n-2-k

n为样本量
k为控制变量个数

  1. 根据自由度和α,查表得到临界值
  2. 比较临界值与偏相关系数rxy.z

    3. 案例

    下表中,若控制住智商这个变量,学习时长与成绩是否具有相关性呢?
    image.png
    解答:

  3. 先判断三个变量两两之间相关性

操作步骤:分析->相关->双变量->将时长、成绩、智商都拖入变量并确认
image.png
结果如下
image.png
只看下半部的三角即可(上下是对称的),3个变量两两相关,相关系数都具有显著的统计学意义。

  1. 控制智商变量,看时长与成绩的关系

操作步骤:分析->相关->偏相关->成绩和时长放入变量,智商放入控制,并确认
image.png
结果如下
image.png
我们可以发现,当智商作为控制变量时,时长和成绩的相关系数仅为0.377,且没有显著的统计学意义。
注:上述情况是为了说明偏相关而编造的数据,不代表真实情况。理论上来讲,学习成绩与学习时长是具有高度相关性的。