本篇文章主要回答为什么将现实世界的数据表示为图、为什么将深度学习与图联系起来、图深度学习面临那些挑战。

图深度学习的动机

将现实世界中的数据表示为图,主要有以下两个原因:

  1. 图提供了数据的通用表示
  2. 许多现实问题可以通过图上的计算任务解决。

图上问题的解决思路:

  1. 建立一种特定于图的新机制
  2. 构建一组特征来表示其节点

图上深度学习的挑战:

  1. 传统深度学习只是针对常规数据。
  2. 规则数据较为简单,而图数据较为复杂。

图特征学习的发展史

图上找到节点表示形式主要有两种方法,分别是特征工程和特征学习。特征工程是手动选择特征,特征学习自动学习节点特征。特征学习可以简单分为图特征选择和图表示学习。

图特征选择

特征选择旨在自动选择一小部分特征,这些子集具有最小的冗余度,但与学习目标有最大的相关性。图的特征选择可以保留原始特征,并且它们的语义通常为学习问题提供关键的见解和解释。然而传统特征选择假定数据实例是独立同分布的,然而图上的数据之间是不独立同分布的,因此在这方面也产生了很多研究。

图表示学习

在早期阶段主要在谱聚类、基于图的降维和矩阵分解的背景下进行了研究。
在深度学习时代,GNN在以下几个方面得到了迅速发展。

  • 提出了大量新的GNN模型,包括谱方法和空间方法。
  • 侧重于图的任务。
  • 图的对抗攻击方法和各种图对抗防御技术。
  • GNN应用到大型图的策略。
  • GNN模型被设计用于处理复杂图。
  • 更多的深度架构被扩展到图上。
  • GNN被广泛应用于许多领域。

参考文献

  1. 《图深度学习》马耀,汤继良