会议要点
1.在最后应用的时候根据需要蛋白质的库的大小,来找到一个合适的cut off 去确定模型,从而可以在预测结果的precision和recall上做一个权衡。
2.在比较模型performance上,我们要在整个pr curve 上比较,现有的通过固定一个cutoff去比较模型的performance,不是一个合适的方法。
3.咨询rongjie,songyang等人在处理 class imbalance问题上,有没有比较好的方法去借鉴,在focal loss层面已经探索的比较完善,不需要进一步做实验了。
4.在现有的方法下,我们需要确定在胰腺数据集上semi-seg的方法相比较fully-mask的方法的performance gap大不大,从而来确定有没有继续做semi-supervise方法的空间。
5.我们要知道现有的semi的方法在解决胰腺数据集存在的问题,其中胰腺数据集的特点是field of view 小,这个特性是不是导致了fully-supervise 的方法都不能很好的解决。
6.我们要针对从胰腺数据一般化出来的的小物体以及长条状的物体的分割。另外,在胰腺数据集上存在positive unlabeled data的现象,另外,我之前survey了self-supervise 的文献,所以方法上是采用self-supervise的方式利用unlabeled的data,来做semi-supervise segmentation并结合positive unlabeled data。
Next Week
1.与rongjie,songyang,shipeng 等人讨论其他处理unbalanced data的方法,不在focal loss上继续探索了。
2.对于semi-supervise 的问题,我们要解决的问题是小物体以及长条状物体的分割,方法是使用self-supervise 的方式来利用unlabeled data,以及利用unlabeled positive data的特性,来解决上述物体的分割问题。
