链接:https://www.shenlanxueyuan.com/open/course/135/lesson/123/liveToVideoPreview

    存在问题
    呈现幂律分布
    image.png

    可以缓解图数据的稀疏性
    介绍可用于稍微修改现有图表数据或从现有图表数据中创建合成数据的想法
    image.png

    论文:Data Augmentation for Graph Neural Networks
    图上的数据增强与传统的nlp,cv不同
    •没有直接的类似于传统的数据增强操作(翻转、旋转、模糊等)。
    •数据对象(节点)的独立性不再成立。
    •很难创建新的数据带有标签的对象(节点)。
    image.png
    因此,提出了 edge manipulation 增加边,删除边
    理由:图有同质性(相同类型的结点有边)
    因此,尝试增加同质性:同类之间增加边,不同类删除边
    左下角图里的 实线:增加的边; 虚线:删除的边
    image.png

    问题:需要知道结点的标签

    解决:
    1.先训练一个链路预测的模型;
    2.基于模型增加/删除边
    image.png
    缺点:
    不适用于inductive的任务;
    增加/删除边的操作是不可导的(离散),无法训练前面的链路预测模型

    修改:把增加/删除边的操作变成sampling
    image.png
    可以看到类内intra的边增多
    image.png

    后面还有,不看了