一.
    下图是SegNet的网络结构,其中蓝色代表卷积+Batch Normalization+ReLU,绿色代表max-pooling,红色代表上采样,黄色是Softmax。
    2.编解码结构SegNet - 图1
    SegNet与FCN的对应结构相比,体量要小很多。这主要得益于SegNet中为了权衡计算量而采取的操作:用记录的池化过程的位置信息替代直接的反卷积操作。具体如下图所示。

    2.编解码结构SegNet - 图2
    有个疑问,这样得出来的upsample的图不是存在大量稀疏参数吗,就算后续经过卷积不也依然如此吗?

    二.变体
    关于变体的分析,可以总结为以下三点:

    • 保留编码器所有特征图所实现的效果最好,在这一点上语义分割边缘轮廓描述度量(BF)体现最为明显。
    • 当推理过程的内存受限时,可以使用编码器特征图的压缩形式(比如缩小维度、使用池化信息等),但需要搭配合适的解码器形式(比如SegNet类型的)来提升表现。
    • 在给定编码器时,越大的解码器效果越好。