外围架构
通过分析用户的行为日志,给用户生成推荐列表,最终展示到网站的界面上。
推荐系统和其他系统之间的关系图
UI部分主要包括物品的标题、缩略图、介绍和推荐理由等。
关于数据的收集和存储,从实时存取的角度看,购买、收藏、评论、评分、分享等行为都是实时存取的,因为只要用户有了这些行为,界面上就需要体现出来。比如用户购买了商品后,用户的个人购买列表中就应立即显示用户购买的商品。而有些行为,如浏览网页的行为就不需要实时存取。
一般来说,需要实时存取的数据存储在数据库的缓存中,而大规模的非实时存取数据存储在分布式文件系统(HDFS)中。
推荐系统构架
为了统筹考虑各种特征,推荐系统需要由多个推荐引擎组成,每个推荐引擎负责一类特征和一种任务,而推荐系统的任务只是将推荐引擎的结果按照一定的权重或优先级合并、排序然后返回。
推荐系统构架图