• Large-scale Information Network Embedding
  • 作者在一阶相似度已经不足以充分的概括网络结构特征时首次提出了二阶相似度的概念
  • 出现的比Node2Vec早

KL散度

  • 直观解读KL散度的数学概念
  • KL 散度是一种衡量两个概率分布的匹配程度的指标,两个分布差异越大,KL散度越大

    LINE的缺点

  • 还不能将一阶和二阶相似度进行联合训练,只能将他们单独训练出embedding,然后在做concatenate


  • line的一阶相似度,只能用于无向图
  • 二阶相似度,只能用于有向图

  • 优化

  • 负采样(类似于word2vec中的Negative sampling)

  • 边采样
    • 边按权重拆分
    • 按概率采样(Alias算法)