链接:https://www.shenlanxueyuan.com/open/course/135/lesson/123/liveToVideoPreview
存在问题
呈现幂律分布
可以缓解图数据的稀疏性
介绍可用于稍微修改现有图表数据或从现有图表数据中创建合成数据的想法
论文:Data Augmentation for Graph Neural Networks
图上的数据增强与传统的nlp,cv不同
•没有直接的类似于传统的数据增强操作(翻转、旋转、模糊等)。
•数据对象(节点)的独立性不再成立。
•很难创建新的数据带有标签的对象(节点)。
因此,提出了 edge manipulation 增加边,删除边
理由:图有同质性(相同类型的结点有边)
因此,尝试增加同质性:同类之间增加边,不同类删除边
左下角图里的 实线:增加的边; 虚线:删除的边
问题:需要知道结点的标签
解决:
1.先训练一个链路预测的模型;
2.基于模型增加/删除边
缺点:
不适用于inductive的任务;
增加/删除边的操作是不可导的(离散),无法训练前面的链路预测模型
修改:把增加/删除边的操作变成sampling
可以看到类内intra的边增多
后面还有,不看了