点击查看【bilibili】

1. 相关分析的适用情况

  1. 自变量和因变量均为数值型变量(定距与定比)

-例如学习时长与学习成绩之间的关系

  1. 有时定类和定序变量也可以看成数值型变量

-例如性别和对某明星喜爱度之间的关系

  1. 最常用的皮尔逊相关分析,研究的是两个变量之间的线性相关

    2. 分析思路

  2. 绘制散点图

一般在进行相关分析前会先做散点图,观察基本情况
image.png

  1. 计算相关系数r

皮尔逊(Pearson)相关系数计算公式为
image.png
可以确定x与y之间相关性的强度和方向

  • -1 ≤ r ≤ 1,r的绝对值越接近1,相关性越强;越接近0,相关性越弱
  • r > 0时为正相关;r < 0时为负相关
  • r < 0.4时低度相关,r > 0.7时高度相关,0.4 ≤ r ≤ 0.7时中度相关
  1. 相关系数的检验,r符合t分布

H:ρ=0(ρ为总体的相关系数)
H:ρ≠0
r的比较分布为t分布,自由度df=n-2,标准误image.png,t=r/SE
image.png

3. 案例

image.png

能否不计算t值就知道r是否统计意义上是否显著?
答案是:可以查表(如下图所示),只需知道r和df即可。
image.png
比如上述案例df=3,α=0.05时,临界值为0.8783,r ≥ 0.8783时,就具有显著的统计意义。
同时从表中也能观察到:
df越大,临界值越小,r具有统计学意义所需的绝对值越小。**