- 实际上也是一种余弦相似度, 不过先对向量做了中心化, 向量a b 各自减去向量的均值后, 再计算余弦相似度
- 皮尔逊相似度计算结果在-1,1之间 -1表示负相关, 1表示正相关,0代表无相关性
- 度量两个变量是不是同增同减
- 皮尔逊相关系数度量的是两个变量的变化趋势是否一致, 不适合计算布尔值向量之间的相关度
皮尔逊相关系数的计算公式如下:

两个向量X、Y,计算出的皮尔逊相关系数含义做如下理解:
- 当相关系数为0时,X和Y两向量不相关
- 当X的值增大(减小),Y值减小(增大),X和Y两向量负相关,相关系数在-1.0到0.0之间。
- 当X的值增大(减小),Y值增大(减小),X和Y两向量正相关,相关系数在0.0到+1.0之间。
通常通过以下取值范围判断向量的相关程度:
- 0.8-1.0 极度相关
- 0.6-0.8 强相
- 0.4-0.6 中等程度相关
- 0.2-0.4 弱相关
- 0.0-0.2 极弱相关或无相关
