推荐系统 - 传统推荐模型特征总结 - 《深度学习》

来源于《深度学习推荐系统》-王喆

模型名称	基本原理	特点	局限性
协同过滤 CF	根据用户的行为历史生成用户-物品共现矩阵，利用用户相似性和物品相似性进行推荐	原理简单、直接，应用广泛	泛化能力差，处理稀疏矩阵的能力差，推荐结果的头部效应较明显
矩阵分解 MF	将协同过滤算法中的共现矩阵分解为用户矩阵和物品矩阵，利用用户隐向量和物品隐向量的内积进行排序并推荐	相较于协同过滤，泛化能力有所加强，对稀疏矩阵的处理能力有所加强	除了用户历史行为数据，难以利用其他用户、物品特征及上下文特征
罗辑回归 LR	将推荐问题转化成类似CTR预估的二分类问题，将用户、物品、上下文等不同特征转换成特征向量，输入罗辑回归模型得到CTR，再按照预估CTR进行排序并推荐	能融合多种类型的不同特征	模型不具备特征组合的能力，表达能力较差
因子分解机 FM	在罗辑回归的基础上，在模型中加入二阶特征交叉部分，为每一维特征训练得到相应特征隐向量，通过隐向量间的内积运算得到交叉特征权重	相比罗辑回归，具备了二阶特征交叉能力，模型的表达能力增强	由于组合爆炸问题的限制，模型不易扩展到三阶特征交叉阶段
FFM	在FM模型的基础上，加入“特征域”的概念，使得每个特征在于不同域的特征交叉时采用不同的隐向量	相比FM，进一步加强了特征交叉能力	模型的训练开销达到了的量级，训练开销大
GDBT+LR	利用GDBT进行“自动化”的特征组合，将原始特征向量转换为离散型特征向量，并输入罗辑回归模型，进行最终的CTR预估	特征工程模型化，使模型具备了更高阶特征组合的能力	GDBT无法进行完全并行的训练，更新所需的训练时长较长
LS-PLM	首先对样本进行“分片”，在每个“分片”内部构建罗辑回归模型，将每个样本的各“分片”概率与逻辑回归的得分进行加权平均，得到最终的预估值	模型结构类似三层神经网络，具备了较强的表达能力	模型结构相比深度学习模型仍比较简单，有进一步提高的空间