解决的问题
GIoU Loss 不足
**
如下图所示,当 GT(绿色框)完全包含预测框(红色框)时,此时 GIoU 退化为 IoU, 无法区分其相对位置关系;此时作者提出的 DIoU 因为加入了中心点归一化距离,所以可以更好地优化此类问题。
基于 IoU 和 GIoU 存在的问题,作者提出了两个问题:
- 第一:直接最小化预测框与目标框之间的归一化距离是否可行,以达到更快的收敛速度。
- 第二:如何使回归在与目标框有重叠甚至包含时更准确、更快。
好的目标框回归损失应该考虑三个重要的几何因素:重叠面积,中心点距离,长宽比。基于问题一,作者提出了 DIoU Loss, 相对于 GIoU Loss 收敛速度更快,该 Loss 考虑了重叠面积和中心点距离,但没有考虑到长宽比;针对问题二,作者提出了 CIoU Loss,其收敛的精度更高,以上三个因素都考虑到了。
设计原理
DIoU(Distance-IoU Loss)
其中定义为预测框
和目标框
的惩罚项。
的含义如下
(具体值看下图,c 表示目标框和预测框的最小外界矩形的对角线距离,
表示欧式距离,d 表示目标框和真实框的中心点距离)
DIoU 的性质:
- 尺度不变性
- 当两个框完全重合时,
, 当 2 个框不相交时
- DIoU Loss 可以直接优化 2 个框直接的距离,比 GIoU Loss 收敛速度更快
- 对于目标框包裹预测框的这种情况,DIoU Loss 可以收敛的很快,而 GIoU Loss 此时退化为 IoU Loss 收敛速度较慢
CIoU(Complete IoU Loss)
CIoU 的惩罚项是在 DIoU 的惩罚项基础上加了一个影响因子,这个因子把预测框长宽比拟合目标框的长宽比考虑进去。 其中
是用于做 trade-off (权衡)的参数,
是用来衡量长宽比一致性的参数,定义为
CIoU Loss function 的定义为