Liu, W., Anguelov, D., Erhan, D., Szegedy, C., Reed, S., Fu, C. Y., & Berg, A. C. (2016, October). Ssd: Single shot multibox detector. In European conference on computer vision (pp. 21-37). Springer, Cham.
SSD详解
主要思路:均匀地在图片的不同位置进行密集抽样,抽样时可以采用不同尺度和长宽比,然后利用CNN提取特征后直接进行分类与回归,整个过程只需要一步,所以其优势是速度快,但是均匀的密集采样的一个重要缺点是训练比较困难,这主要是因为正样本与负样本(背景)极其不均衡。
设计理念:
(1)采用了多尺度的特征图,比较大的特征图来用来检测相对较小的目标,而小的特征图负责检测大目标
(2)采用卷积进行检测
(3)设置了先验框,减少训练难度,每个单元会设置多个先验框,其尺度和长宽比存在差异
对于每个先验框,预测两部分: 1.类别或者置信度 2.先验框的location(cx,cy,w,h),分布表示中心坐标和宽高。实际预测的是offset。
对于一个大小为的特征图,共需要
个预测值,
是每个单元先验框的数量。