DIoU/CIoU

浏览 124 扫码分享 2023-11-24 00:58:31

解决的问题
设计原理
- DIoU（Distance-IoU Loss）
- CIoU（Complete IoU Loss）
效果
参考

解决的问题

GIoU Loss 不足
**
如下图所示，当 GT（绿色框）完全包含预测框（红色框）时，此时 GIoU 退化为 IoU, 无法区分其相对位置关系；此时作者提出的 DIoU 因为加入了中心点归一化距离，所以可以更好地优化此类问题。

基于 IoU 和 GIoU 存在的问题，作者提出了两个问题：

第一：直接最小化预测框与目标框之间的归一化距离是否可行，以达到更快的收敛速度。
第二：如何使回归在与目标框有重叠甚至包含时更准确、更快。

好的目标框回归损失应该考虑三个重要的几何因素：重叠面积，中心点距离，长宽比。基于问题一，作者提出了 DIoU Loss, 相对于 GIoU Loss 收敛速度更快，该 Loss 考虑了重叠面积和中心点距离，但没有考虑到长宽比；针对问题二，作者提出了 CIoU Loss，其收敛的精度更高，以上三个因素都考虑到了。

设计原理

DIoU（Distance-IoU Loss）

DIoU/CIoU - 图2
其中 DIoU/CIoU - 图3 定义为预测框 DIoU/CIoU - 图4 和目标框 DIoU/CIoU - 图5 的惩罚项。 DIoU/CIoU - 图6 的含义如下

DIoU/CIoU - 图7 （具体值看下图，c 表示目标框和预测框的最小外界矩形的对角线距离， DIoU/CIoU - 图8 表示欧式距离，d 表示目标框和真实框的中心点距离）

DIoU 的性质：

尺度不变性
当两个框完全重合时，, 当 2 个框不相交时
DIoU Loss 可以直接优化 2 个框直接的距离，比 GIoU Loss 收敛速度更快
对于目标框包裹预测框的这种情况，DIoU Loss 可以收敛的很快，而 GIoU Loss 此时退化为 IoU Loss 收敛速度较慢

CIoU（Complete IoU Loss）

DIoU/CIoU - 图12

CIoU 的惩罚项是在 DIoU 的惩罚项基础上加了一个影响因子 DIoU/CIoU - 图13 ，这个因子把预测框长宽比拟合目标框的长宽比考虑进去。其中
DIoU/CIoU - 图14 是用于做 trade-off （权衡）的参数， DIoU/CIoU - 图15
DIoU/CIoU - 图16 是用来衡量长宽比一致性的参数，定义为 DIoU/CIoU - 图17

CIoU Loss function 的定义为 DIoU/CIoU - 图18

效果

参考

https://arxiv.org/abs/1911.08287
github 地址：https://github.com/Zzh-tju/DIoU-darknet

若有收获，就点个赞吧

上一篇:

下一篇:

让时间为你证明

展开/收起文章目录