1 余弦相似度

余弦相似度公式:
构建邻接矩阵的方法: - 图1
这里的分别代表向量A和B的各分量。
原理:多维空间两点与所设定的点形成夹角的余弦值。
范围:[-1,1],值越大,说明夹角越大,两点相距就越远,相似度就越小。
余弦相似度模型:根据用户评分数据表,生成物品的相似矩阵;

2 欧氏距离相似度

构建邻接矩阵的方法: - 图2
原理:利用欧式距离d定义的相似度s,s=1 /(1+d)。
范围:[0,1],值越大,说明d越小,也就是距离越近,则相似度越大。
欧式相似度模型:根据用户评分数据表,生成物品的相似矩阵;

3 余弦相似度和欧氏距离相似度总结:

余弦相似度衡量的是维度间取值方向的一致性,注重维度之间的差异,不注重数值上的差异,而欧氏度量的正是数值上的差异性。
主要看数值的差异,比如个人兴趣,可能数值对他影响不大,这种情况应该采用余弦相似度,而物品的相似度,例如价格差异数值差别影响就比较大,这种情况应该采用欧氏度量。

4 Kn