解决的问题

GIoU Loss 不足
**
如下图所示,当 GT(绿色框)完全包含预测框(红色框)时,此时 GIoU 退化为 IoU, 无法区分其相对位置关系;此时作者提出的 DIoU 因为加入了中心点归一化距离,所以可以更好地优化此类问题。

image.png

基于 IoU 和 GIoU 存在的问题,作者提出了两个问题:

  • 第一:直接最小化预测框与目标框之间的归一化距离是否可行,以达到更快的收敛速度。
  • 第二:如何使回归在与目标框有重叠甚至包含时更准确、更快。

好的目标框回归损失应该考虑三个重要的几何因素:重叠面积,中心点距离,长宽比。基于问题一,作者提出了 DIoU Loss, 相对于 GIoU Loss 收敛速度更快,该 Loss 考虑了重叠面积和中心点距离,但没有考虑到长宽比;针对问题二,作者提出了 CIoU Loss,其收敛的精度更高,以上三个因素都考虑到了。

设计原理

DIoU(Distance-IoU Loss)

DIoU/CIoU - 图2
其中DIoU/CIoU - 图3定义为预测框 DIoU/CIoU - 图4 和目标框 DIoU/CIoU - 图5 的惩罚项。DIoU/CIoU - 图6 的含义如下

DIoU/CIoU - 图7(具体值看下图,c 表示目标框和预测框的最小外界矩形的对角线距离,DIoU/CIoU - 图8 表示欧式距离,d 表示目标框和真实框的中心点距离)

image.png
DIoU 的性质:

  • 尺度不变性
  • 当两个框完全重合时,DIoU/CIoU - 图10, 当 2 个框不相交时 DIoU/CIoU - 图11
  • DIoU Loss 可以直接优化 2 个框直接的距离,比 GIoU Loss 收敛速度更快
  • 对于目标框包裹预测框的这种情况,DIoU Loss 可以收敛的很快,而 GIoU Loss 此时退化为 IoU Loss 收敛速度较慢

CIoU(Complete IoU Loss)

DIoU/CIoU - 图12

CIoU 的惩罚项是在 DIoU 的惩罚项基础上加了一个影响因子DIoU/CIoU - 图13,这个因子把预测框长宽比拟合目标框的长宽比考虑进去。 其中
DIoU/CIoU - 图14 是用于做 trade-off (权衡)的参数, DIoU/CIoU - 图15
DIoU/CIoU - 图16 是用来衡量长宽比一致性的参数,定义为 DIoU/CIoU - 图17

CIoU Loss function 的定义为 DIoU/CIoU - 图18

效果

image.png

image.png

image.png

参考