召回和排序有各自的算法
基于用户过滤 基于内容过滤 基于画像过滤
找相似用户又是一种算法 聚类常用
看相似用户喜欢的商品(即比较概率),排序,从大概率开始推荐
用相似矩阵 衡量的用户之间,商品之间的相似度
生成相似矩阵非常耗时,可能几千个用户就要跑几个小时
如何将其转化为相似矩阵
一种方案: 对于两个人都看过的公共电影,计算他们评分的距离
推荐系统的魅力在于,针对不同的业务需求,设计方案不同
想尽办法先搞定矩阵,再关注细节
皮尔寻距离则使用协防差:
两组数据的协防差: 也可以用相关性 描述相似
现实中,可能上限标准不同,尽管ab 二人评分的欧式距离差很大,但形态相似,反而更能说明二人相似
描述相关,不能只看绝对分数,还要看分布形态
拿到矩阵后,考虑召回