会议要点

1.通过mask8种氨基酸可能会更有效一点,现在只是mask 4种修饰。最后转化为sequence labeling的问题
2.磷酸化修饰预测的问题significance需要和ihuman那边确认一下
3.model不是copy sequence,如果我不supervise 那么模型是随意预测的,所以只是对于supervise 的预测是有效,比如我只要模型预测mask的区域,则不mask的区域是不能很好的预测出来的
4.transformer 单个character 的self-attention 效果有限,这个不同于NLP以word为单位,attention的效果明显。通过pretrain的方式也无改善,所以将transformer作为单个单元预测RT效果不好,可能用前面用几个conv,来以几个amino acid作为一个单元,会有助于预测RT。
5.合作方建立好最终的pipline,从库里去retrieve,提高retrieve的效率或许是提高的方向

6.我们有两层创新,第一层是用新的工具,第二层是新的工具改善了最后的结果

Next Week

1.Finish fine tune on DIA-phos dataset based on the existing improvements.
2.Try to be familiar with the ion intensity prediction task by “Prosit: proteome-wide prediction of peptide
tandem mass spectra by deep learning”
3.Ask the significance of prediction modification site from iHuman