18’IJCAI

总结

第一个在电子商务领域考虑了mutual influence的排序框架。
该文章强调了在电子商务领域物品间的影响。该工作将物品间相互影响合并入物品原有的特征中,通过DNN先对后买概率进行预测,然后为了更好的考虑物品相互间影响对最终序列的影响,借助带attention的RNN得到一个最优的排列。

Motivation

在web搜索领域,文档之间相互影响的作用已经从搜索结果的多样性角度进行了研究。但在电子商务搜索研究中很少有工作对物品间的相互影响进行研究。而且web搜索和电子商务搜索之间存在的差异,使得web搜索中的方法不能直接拿来使用。

Method

本文提出的方法,以优化GMV为目标。将该问题抽象为求GMV的均值最大:
image.png
由此,该方法将排序分解成两个任务:

  • 第一个任务是相互影响对购买概率的作用
  • 第二个任务是根据购买概率的估计,找到最优的排名顺序

    第一阶段方法

    1. 首先将物品间的互相影响信息合并进每一个item的特征中。

    具体合并方法是基于本文提出的一种全局特征扩展方法。即直接将一个全局特征向量和当前item向量concat。而每个item全局特征为其他item对当前item的一种影响表征,具体如下:
    image.png
    fl为当前item的表征。

    2. 基于以上的物品特征使用DNN对物品购买概率进行预测。

    三层,ReLU, sigmoid,BCELoss。

    3. 基于DNN的打分结果,使用RNN捕获购买概率估计中对排序顺序相关的影响。

    直接基于DNN的结果打分的话就只是简单的排序。

    第二阶段方法

    由于使用了RNN,第二阶段任务看成一个序列生成问题,并使用beam search的算法解决该问题。
    image.png
    但是beam search只用于线上阶段,训练时不适用beam search。
    但是当使用LSTM作为RNN的单元时,发现top4的物品对20th的物品起不到影响作用。于是设计了如下带attention的RNN。
    image.png
    在这种带有attention的RNN,不仅取决于当前的hidden vector,同时也受前面所有hidden vector的权重和影响。公式如下:
    image.pngimage.png image.pngimage.png
    这使得长距离依赖得以实现。

缺点

  1. 提取全局特征时,使用了人工设计的规则。
  2. 生成最终排序时,将其看成了一个序列生成问题。也即强加了当前位置的物品只受前面前序物品影响的这一假设。
  3. RNN的训练过程不使用beamSearch,而上线过程使用beamSearch存在gap。