image.png

说在开头

CVPR2020的一篇工作。引入了超分辨率恢复任务作为辅助任务,来帮助语义分割网络获得更高分辨率且更加良好预测。这篇文章不同于现有的方法,为了尽可能维持高分辨率的特征信息(这被证实是有效的),采用扩张卷积等策略维持较高的特征分辨率,同时还可能会使用更大分辨率的输入,这些都增加了运行时的负担,很不利于实际的应用。
这篇文章从一个新的角度出发——我不再去要求较高分辨率的输入或者维持较高分辨率的特征,而是争取预测一个更加细致的更高分辨率的输出。相当于将关注的内容更加切近了实际的需求,我们所做的一切都是为了获得更加贴近于真值(更好的、更高分辨率的)的预测
image.png
为了满足这个需求,本文对现有语义分割算法(本文提出的是一种增强现有方法的策略)引入了超分辨率恢复的任务,这正是干这个的。整体组成了一个共享编码器的双分支双任务结构(SSSR语义分割超分辨分支+SISR单图像超分辨分支),两个分支的预测都具有原始数据的分辨率(这一点算是改动了现有分割结构)。SISR分支仅仅是训练时用来优化SSSR的特征的,所以测试时是可以去掉的。这样可以实现更加轻量的推理结构。

此外,这两个流共享相同的特征提取器,并且在训练过程中通过重建监督对SISR分支进行了优化,并且在推理阶段将其从网络中删除,使得该结构不会增加额外的开销。 我们可以很容易地发现SISR包含更完整的对象结构。尽管这些结构没有明确地暗示类别,但是它们可以通过像素和像素或区域和区域之间的关系有效地分组。众所周知,这些关系可以隐式地传递语义信息,从而有利于语义分割的任务。因此,我们应用从SISR中恢复的高分辨率特征来指导学习SSSR的高分辨率表示,并且这些细节可以通过内部像素之间的相关性或关系来建模。关系学习可以弥补解码器的简单设计。

使用超分辨作为辅助任务来提升主任务的性能的,ECCV2020还有一篇: