与传统的机器学习模型相比,深度学习模型的表达能力更强,能够挖掘出更多数据中潜藏的模式。深度学习的模型结构非常灵活,能够根据业务场景和数据特点,灵活调整模型结构,使模型与应用场景完美契合。
《深度学习推荐系统》PDF+王喆
《深度学习推荐系统》PDF,带目录,304页,文字可复制,王喆编著
下载: https://pan.baidu.com/s/1aUbP6Ukun0_yCYDwEjIrbw
提取码: jvjd
深度学习推荐系统从深度学习推荐模型、Embedding技术、推荐系统工程实现、模型评估体系、业界前沿实践等几个方面介绍了这场技术革命中的主流技术要点。
与传统机器学习不同的是,深度学习将复杂的、需要专业化建模与优化能力、专业化分布式计算编程能力才能搞定的工业级机器学习算法研发闭环打破,提供了如下搭积木式的算法研发新范式:
( 1 )大量优秀且开源的深度学习训练框架提供了封装好的基础模块,新模型算法的设计变成了工具化组装。
( 2 )深度模型的优化可以采用一系列标准的优化器轻松完成,无须人工进行梯度的求导及优化算法的设计,且大部分优化器已经嵌入在深度学习框架中,无须编程开发。
( 3 )算法工程师或科学家可以将主要研发精力集中到对领域问题的理解和模型设计,通过类似土木工程师绘图的方式搭建深度模型架构图,接下来的工作交给软件工程师,通过对深度学习框架计算效率和性能的优化,即可完成模型的训练。换句话说,模型的设计和实现是解耦的。
这种全新的研发模式,使得深度学习时代新模型、新算法的研发与创新层出不穷,极大地推高了工业应用领域的技术水位,带来了真金白银的巨大价值。如今, 一名技术实习生每天可以轻松完成数个深度模型算法的实验尝试,而在之前的数十年间,能被工业界应用的机器学习模型屈指可数,这是巨大的生产力提升。可以说,深度学习解放了工业界对于复杂机器学习模型应用的畏惧心和想象力。
AutoRec 模型是一个标准的自编码器,它的基本原理是利用协同过滤中的共现矩阵,完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分,进而进行推荐排序。自编码器是指能够完成数据”自编码”的模型。无论是图像、音频,还是数据,都可以转换成向量的形式进行表达。假设其数据向量为r ,自编码器的作用是将向量r 作为输入,通过自编码器后,得到的输出向量尽量接近其本身。