相关性分析

相关系数:考察两个事物(在数据里我们称之为变量)之间的相关程度。
[详细介绍]
如果有两个变量:X、Y,最终计算出的相关系数的含义可以有如下理解:

  • 当相关系数为0时,X和Y两变量无关系。
  • 当X的值增大(减小),Y值增大(减小),两个变量为正相关,相关系数在0.00与1.00之间。
  • 当X的值增大(减小),Y值减小(增大),两个变量为负相关,相关系数在-1.00与0.00之间。

相关系数的绝对值越大,相关性越强,相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。

通常情况下通过以下取值范围判断变量的相关强度:

|r|<0.3 不存在线性关系 0.3<|r|<0.5 低度线性关系 0.5<|r|<0.8 显著线性关系 |r|>0.8 高度线性关系

Pearson(皮尔逊)相关系数

1、简介
Pearson 相关评估两个连续变量之间的线性关系。当一个变量中的变化与另一个变量中的成比例变化相关时,这两个变量具有线性关系。

例如,您可能使用 Pearson 相关来评估您生产设施温度的升高是否与巧克力涂层的厚度减少有关。

2、适用范围
当两个变量的标准差都不为零时,相关系数才有定义,皮尔逊相关系数适用于:

  • 两个变量之间是线性关系,都是连续数据。
  • 两个变量的总体是正态分布,或接近正态的单峰分布。
  • 两个变量的观测值是成对的,每对观测值之间相互独立。

Spearman Rank(斯皮尔曼等级)相关系数

1、简介
Spearman 相关评估两个连续或顺序变量之间的单调关系。_在单调关系中,变量倾向于同时变化,但不一定以恒定的速率变化。_Spearman 相关系数基于每个变量的秩值(而非原始数据)。

Spearman 相关通常用于评估与顺序变量相关的关系。例如,您可能会使用 Spearman 相关来评估员工完成检验练习的顺序是否与他们工作的月数相关。

2、适用范围
斯皮尔曼等级相关系数对数据条件的要求没有皮尔逊相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关系数来进行研究。

Kendall Rank(肯德尔等级)相关系数

1、简介
在统计学中,肯德尔相关系数是以Maurice Kendall命名的,并经常用希腊字母τ(tau)表示其值。肯德尔相关系数是一个用来测量两个随机变量相关性的统计值。一个肯德尔检验是一个无参数假设检验,它使用计算而得的相关系数去检验两个随机变量的统计依赖性。肯德尔相关系数的取值范围在-1到1之间,当τ为1时,表示两个随机变量拥有一致的等级相关性;当τ为-1时,表示两个随机变量拥有完全相反的等级相关性;当τ为0时,表示两个随机变量是相互独立的。

2、适用范围
肯德尔相关系数与斯皮尔曼相关系数对数据条件的要求相同,可参见统计相关系数(2)—Spearman Rank(斯皮尔曼等级)相关系数及MATLAB实现中介绍的斯皮尔曼相关系数对数据条件的要求。

显著性检验方法

  1. 皮尔逊检验
    适用于序列数据,
  2. t检验
    适用于随机数组,
  3. 方差分析(ANOVA)又称“变异数分析”或“F检验”
    用于两个及两个以上样本均数差别的显著性检验。
    方差分析的假定条件为:
    (1)各处理条件下的样本是随机的。
    (2)各处理条件下的样本是相互独立的,否则可能出现无法解析的输出结果。
    (3)各处理条件下的样本分别来自正态分布总体,否则使用非参数分析。
    (4)各处理条件下的样本方差相同,即具有齐效性。
    方差分析主要用途:①均数差别的显著性检验,②分离各有关因素并估计其对总变异的作用,③分析因素间的交互作用,④方差齐性检验。

spearman相关系数

在统计学中, 以查尔斯·斯皮尔曼命名的斯皮尔曼等级相关系数,即spearman相关系数。经常用希腊字母ρ表示。 它是衡量两个变量的依赖性的非参数指标。 它利用单调方程评价两个统计变量的相关性。 如果数据中没有重复值, 并且当两个变量完全单调相关时,斯皮尔曼相关系数则为+1或−1。

pearson积矩相关系数

在统计学中,皮尔逊积矩相关系数(英语:Pearson product-moment correlation coefficient,又称作 PPMCC或PCCs, 文章中常用r或Pearson’s r表示)用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。在自然科学领域中,该系数广泛用于度量两个变量之间的相关程度。