No1. Aerial Imagery Pixel-level Segmentation

阅读时间:2022-11-02

期刊: SN Computer Science 作者: Iqbal H. Sarker 发表日期:22 March 2021

Abstract:

航空影像可用于全球范围内的重要工作。尽管如此,使用神经网络体系结构对这些数据的分析仍落后于流行数据集 (例如PASCAL VOC,CityScapes和Camvid) 的当前最新技术。在本文中,我们弥合了这些流行的数据集和航空影像数据之间的性能差距。在多类环境中,使用最先进的神经网络体系结构对航空图像所做的工作很少。我们有关数据增强,归一化,图像大小和丢失函数的实验为航空图像分割数据集提供了高性能设置的见解。我们的工作,使用最先进的DeepLabv3 + Xception65架构,在DroneDeploy验证集上实现了平均70% 的IOU。有了这个结果,我们显然优于当前公开可用的最先进的验证集mIOU (65%) 性能与5%。此外,据我们所知,测试一下集没有mIOU基准。因此,我们还使用性能最佳的DeepLabv3 Xception65架构在DroneDeploy测试一下集上提出了一个新的基准,mIOU得分为52.5%。

Keywords:

Computer Vision, Convolutional Neural Networks, Remote sensing(遥感), semantic segmentation

Article skeleton:

画板

Related images:

No2. 《DeepLabV3+》

题目:Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation

阅读时间:2022-11-02

期刊: SN Computer Science 作者: Iqbal H. Sarker 发表日期:22 March 2021

Abstract:

空间金字塔池化模块或编码解码器结构用于深度神经网络进行语义分割任务。前一种网络能够通过以多种速率和多个有效视野使用过滤器或池化操作探测输入特征来编码多尺度上下文信息,而后一种网络可以通过逐渐恢复空间信息来捕获更清晰的对象边界。在这项工作中,我们建议结合两种方法的优点。具体来说,我们提出的模型 DeepLabv3+ 通过添加一个简单而有效的解码器模块来扩展 DeepLabv3,以细化分割结果,尤其是沿着对象边界。我们进一步探索 Xception 模型,并将深度可分离卷积应用于 Atrous 空间金字塔池和解码器模块,从而产生更快、更强大的编码器-解码器网络。我们证明了该模型在 PASCAL VOC 2012 和 Cityscapes 数据集上的有效性,在没有任何后处理的情况下实现了 89% 和 82.1% 的测试集性能。我们的论文附有在 https://github.com/tensorflow/models/tree/master/research/deeplab 的 Tensorflow 中提出的模型的公开参考实现。

Keywords:

Article skeleton:

画板

Related images:

语义分割论文笔记 - 图3

语义分割论文笔记 - 图4

语义分割论文笔记 - 图5

In the end

阅读时间:2022-06-29

期刊: SN Computer Science 作者: Iqbal H. Sarker 发表日期:22 March 2021 Abstract: Keywords: Article skeleton: Related images: