协同过滤(Collaborative Filtering)
简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。
应用例子:喜欢此影片的用户也喜欢…
问题:
虽然协同过滤作为一推荐机制有其相当的应用,但协同过滤仍有许多的问题需要解决。整体而言,最典型的问题有
- 新用户问题(New User Problem) 系统开始时推荐质量较差;
- 新项目问题(New Item Problem) 质量取决于历史数据集;
- 稀疏性问题(Sparsity);
系统延伸性问题(Scalability)
过拟合
在训练集上有比较好的表现,但实际效果中却大打折扣