image.png

扩张卷积可以增加神经元的接收野,若用于替换卷积网络中的下采样层,即维持了feature map的空间分辨率,又可以保持后续神经元接收野的分辨率。论文据此提出了dilated residual networks(DRN),实验表明DRN在图像分类等任务上优于不加扩张卷积的网络。此外,使用空洞卷积会产生”gridding”问题,论文提出了一些解决方案。

image.png

卷积神经网络使用池化和下采样获取更抽象的特征,但这伴随着是feature map空间分辨率的下降,这会丢失很多敏感细节,不利于涉及密集预测的图像场景解析任务。论文认为池化和下采样不是必须的,在残差网络的结构上,使用扩张卷积替换模型内部的下采样层来提高输出的准确率。

在ImageNet上DRN的输出分辨率为28×28(原Resnet输出7×7,空间分辨率提高了4倍,替换了2个下采样),论文指出在此基础上使用平均池化效果不错。使用扩张卷积会带来”gridding”问题,论文提出了一种用于消除影响的解决方案,这进一步提高了DRN的准确率。同时验证了DRN在其他任务:例如语义分割任务上表现也很不错。

在卷积神经网络中使用下采样会降低feature的空间分辨率,这会丢失许多细节,从而影响模型对小型目标乃至目标之间关系的识别。

论文以Resnet为基础,提出了一个改进方法,在resnet的top layers移除下采样层,这可以保持feature map的空间分辨率,但后续的卷积层接收野分辨率下降了,这不利于模型聚合上下文信息。针对这一问题,论文使用扩张卷积替换下采样,在后续层合理使用扩张卷积,在保持feature map的空间分辨率同时维持后续层接收野的分辨率。

解决gridding

现象:

image.png

论文针对这一问题提出了一些解决办法。示意图如下:

image.png

参考文章