FM为什么能筛选出重要的嵌入向量?

  • 如何从梯度下降更新参数的角度理解?GB。梯度衡量的是各个参数对损失函数贡献的大小。经过迭代,重要特征的权重自然比较大。

冷启动问题

参考《深度学习推荐系统》159页。

  • 利用现有数据
    • 热门推荐。
    • 规则推荐:利用静态特征做规则。用户的性别、年龄、位置等。商品的名称、价格、详情、标签等。
    • 模型推荐:利用静态特征。
  • 扩展现有数据
    • 聚类:定义group特征,包括行为特征和静态特征;利用相似用户或物品的特征。
    • 数据迁移:从别的APP、数据商获取有用的数据。
    • 探索:将少量内容试探性的推荐给用户,根据反馈完善静态特征和行为特征。
    • 鼓励用户完善信息。

如果用一个月的数据训练deepFm模型,那超过一个月不活跃的用户embedding怎么处理?

  • xh:定义group_id,group_id的缺失率会远小于user_id,并且包含很多有用信息。
  • gb:还有其它特征顶着,例如用户性别emb、买过商品emb等。只要大部分重要特征都有值,对预测得分的影响就不大。