召回和排序有各自的算法

    推荐引擎 - 图1基于用户过滤 基于内容过滤 基于画像过滤

    找相似用户又是一种算法 聚类常用

    看相似用户喜欢的商品(即比较概率),排序,从大概率开始推荐

    用相似矩阵 衡量的用户之间,商品之间的相似度

    生成相似矩阵非常耗时,可能几千个用户就要跑几个小时

    推荐引擎 - 图2 如何将其转化为相似矩阵

    一种方案: 对于两个人都看过的公共电影,计算他们评分的距离

    推荐系统的魅力在于,针对不同的业务需求,设计方案不同

    想尽办法先搞定矩阵,再关注细节

    皮尔寻距离则使用协防差:

    两组数据的协防差: 也可以用相关性 描述相似

    推荐引擎 - 图3

    推荐引擎 - 图4 现实中,可能上限标准不同,尽管ab 二人评分的欧式距离差很大,但形态相似,反而更能说明二人相似

    描述相关,不能只看绝对分数,还要看分布形态

    拿到矩阵后,考虑召回

    推荐引擎 - 图5