推荐算法是机器学习的一个子领域,以往的推荐往往围绕商品、用户等等,而往往忽略了图片或视频等的内容载体。本文将从前沿的计算设计视角,以羚珑设计千人千面推荐算法为例,带你了解什么是设计新范式。
▎设计与信息传递
随着流量红利逐渐消失,精细化营销越来越成为平台及品牌的关注重点。从用户精细化运营到商品千人千面,解决的其实是信息优选问题,即是在海量电商营销信息及商品内容中进行更有效的信息分发。而设计创意作为信息内容分发的视觉载体,可以说扮演着信息传递“最后一公里”的角色,如何面向海量用户以最合适的设计方案传递信息成为了进一步提升流量效率的破局关键点。
“一千个人眼中就有一千个哈姆雷特”,用户的不同个性不同背景决定了一千个用户对于设计式样会有一千个看法,而智能设计推荐恰恰能基于海量用户行为数据以算法迭代的方式,从复杂不确定的特征中不断地通过熵减,通过计算设计找到个性化的Design-fit。
▎设计假设探索及数据验证
为了验证“对的设计能提升流量效率”的猜想,羚珑设计团队基于京东站内上千个设计方案进行研究与分析,并对“色系”及“布局”元素进行了科学严谨的AB灰度测试。
在AB灰度测试期间,我们通过品类在设计方案下的点击通过率CTR数据的统计分析得出,不同色系及布局元素对超过80%品类产生显著性提升效果,这也证明了“对的设计能提升流量效率”的猜想,推动我们开始进一步探索设计千人千面推荐算法。
▎羚珑设计推荐算法构想
不同于传统的商品推荐及内容推荐,设计推荐的原始数据往往是非结构化数据,比如图片、视频、音乐等等。因此在构建羚珑设计推荐算法过程中,我们重点解决了几个问题,第一是如何基于图片或视频进行数据结构化存储及参数化,即把设计方案通过尽可能小的信息损耗转化为机器可以理解的数据;第二是在设计方案特征化的基础上,如何挖掘人、货、场、设计四者之间的关联关系;而最后,则是如何通过多目标的优化策略提升设计推荐服务的准确性。
1 设计参数化
每一个设计方案都代表了“美”的设计结果,如何把设计师的方法和技巧告诉机器并让其理解和运作,这便是设计参数化要解决的问题,从非结构化的二维图片转化成结构化数据。
2 设计原子化及特征抽取
图片结构化解析成为可能后,我们开始尝试对设计方案进行原子化拆分以及特征抽取,让机器可以最大程度的理解不同图片的设计意图,设计原子和特征的丰富程度也将决定机器学习天花板的高度。
①设计内容特征
原生特征:风格、构图布局、商品呈现、背景装饰、文案、按钮、Logo等
派生特征:图像显著性、美学和谐度
除了通过设计原子化拆分结构设计创意外,羚珑还通过海量业务数据及显性、隐形埋点数据来获取商品及用户特征,更全面的理解信息本体及信息受众。同时为了进一步精细到用户与设计的交互状态,我们还加入了丰富的上下文特征,立体地感知信息受众状态。
②用户特征
用户基础属性、用户偏好特征、用户行为特征
③商品特征
商品品类、商品品牌、商品质量、商品活跃度
④上下文特征
环境上下文:时间、季节、天气
媒介上下文:设备型号、设备主题
语境上下文:情绪、心理
3 特征评估选择及构建
基于设计原子化解构及用户、商品、上下文特征梳理,我们获得了比较完整的推荐特征池,下一步则是从匹配度及贡献度对特征进行评估,筛选出合适的特征子集来构建特征。通用的特征评估方法会有以下两种,基于统计量判断特征质量,如方差、皮尔森系数、特征数据覆盖率等;而另外是通过算法模型参数优化来判断特征重要性,如基于树模型的算法框架可以对每颗树的分类节点进行重要性排序及合理剪枝。
4 推荐服务框架构建
正如前面提到的一样,数据和特征决定了机器学习的上限,而对于模型和算法只是不断逼近这个上限。在我们的推荐场景中,推荐算法的本质就是匹配商品的信息特征、用户的兴趣特征和素材的设计特征。基于设计推荐特征数据结构及特性,一般会有以下几种算法模型方案,考虑到篇幅限制本部分只做简单介绍。
①回归树模型
业界比较常用的算法框架包括GBDT、XGBoost和LightGBM,通过多棵回归树迭代来共同决策,获得目标的最小损失实现最优排序;
②深度排序模型
随着训练数据的不断累计,在大量数据集下深度学习模型相对于传统树模型Logistic回归更具优势。在深度学习范畴下,CTR预测算法包括FM、FFM、DeepFM等,通过不同特征的交叉建模构建二元分类模型进行预测。
随着数据与经验的积累,羚珑也不断在摸索和迭代设计推荐算法模型,努力找到效率与效果的最优解。
5 动态推荐优化目标
除了关注模型本身效果外,一切技术应用出发点都是业务需求。在设计素材提效的场景下,羚珑希望基于算法多目标优化策略来实现动态推荐优化,通过模型多目标建模来提高模型灵活性。从业务场景出发,无论是短期平台目标流量提效侧重CTR,还是长期用户生态目标关注LTV,都能提供多目标的设计推荐策略。
▎设计推荐算法应用落地
羚珑设计推荐算法V1.0近期在京东APP关键素材位进行了灰度测试,在素材推荐曝光期间,算法推荐组对比算法对照组,整体设计模板点击通过率CTR提升70%,单个设计模板点击通过率CTR提升最高达450%,真正实现了素材层面的千人千面助力提效。
▎未来展望
现在的羚珑智能设计,已经涵盖了包括广告图设计、视频设计、页面设计以及小程序设计等设计形式。放眼未来,羚珑智能设计希望围绕多模态的设计载体,在平台公域与电商私域持续挖掘设计价值:在公域流量场进一步链接设计生产与设计消费,通过数据/算法驱动的“反向定制C2M”提高设计反馈效率,不断迭代公域设计规范,努力实现美学、效率、效果的最优解;而面向私域运营,羚珑希望从设计规范出发,通过轻便化的AI设计引擎赋能设计师和用户,提供更专业更个性的设计诊断与设计生成能力。