image.png
YOLO-V1与YOLO-V2对比

1、YOLO-V2做出的改进

YOLO-V2-Batch Normalization

  • V2版本舍弃Dropout,卷积后全部加入Batch Normalization
  • 网络的每一层的输入都做了归一化,收敛相对更容易
  • 经过Batch Normalization处理后的网络会提升2%的mAP
  • 从现在的角度来看,Batch Normalization已经成网络必备处理

2、网络结构特点

2.2 YOLO-V2-更大的分辨率

  • V1训练时用的是224224,测试时使用448448
  • 可能导致模型水土不服,V2训练时额外又进行了10次448*448 的微调
  • 使用高分辨率分类器后,YOLOv2的mAP提升了约4%

2.3 YOLO-V2-网络结构

  • DarkNet,实际输入为416*416
  • 没有FC层,5次降采样,(13*13)
  • 1*1卷积节省了很多参数

image.png

YOLO-V2-聚类提取先验框
faster-rcnn系列选择的先验比例都是常规的,但是不一定完全适合数据集
K-means聚类中的距离:image.png
image.png

YOLO-V2-Anchor Box

  • 通过引入anchor boxes,使得预测的box数量更多(1313n)
  • 跟faster-rcnn系列不同的是先验框并不是直接按照长宽固定比给定