《Molecular Contrastive Learning with Chemical Element Knowledge Graph》
    链接:https://arxiv.org/pdf/2112.00544.pdf?ref=https://githubhelp.com
    AAAI 2022

    又在AAAI 2022里找文章了我。这篇思想也不复杂但足够精巧,大致记录一下。
    题目就可以看出来是用对比学习学分子embedding的,对比学习可以下手的地方简单一点就是增强那块儿,作者就爬了元素周期表里元素的属性,构建了个知识图谱,里面的三元组就是类似(Gas, isStateOf, Cl)这种,然后把这个知识图谱里的信息加入到分子结构中,给原子添加边和新的节点作为原来的graph的augmentation版本,比如一个化合物里有氯,还有氧,知识图谱里同时有(Gas, isStateOf, Cl)和(Gas, isStateOf, O),当做增强时,Cl和O之间本来没有bond,现在可以加一个属性节点,并且该节点同时连着Cl和O。
    剩下的操作其实比较常规,简单理一下。先看框架:
    image.png
    第一个就是前面解释过的augmentation,接下来就是用encoder做嵌入。上下两个encoder,上面的是对原图进行嵌入的,下面是对增强之后的图进行嵌入的,原图encoder就用简单GCN,而另一个复杂些,因为graph中有原子和属性两种节点,所以设计了不同的message passing,具体就是把二者划为不同类型的邻居,分别计算注意力,算法如下。
    image.png
    Readout的时候还用到GRU,set2set,不多贴了。
    最后就是对比学习的模块。公式还是下面那套,负采样不是随便采集个minibatch用里面其他的,而是用相似度比较近的做了个minibatch,相似度用morgan fingerprint来算,以后有需要再深入研究。
    image.png
    实验部分简单看了一眼,提升还是蛮大的。image.png
    感觉不是启发很大的文章,不过配图配色是真的好看。看这个消融实验的histogram就很好看。
    image.png