YOLO-V1
- 经典的one-stage方法
- You Only Look Once,名字就已经说明了一切!
- 把检测问题转化成回归问题,一个CNN就搞定了!
- 可以对视频进行实时检测,应用领域非常广!

核心思想:

网络架构:
输入一个448x448x3的图像,进行卷积,得到一个7x7x1024的特征图
每个数字的含义:
- 10 =(X,Y,H,W,C)*B(2个)
- 当前数据集中有20个类别
- 7*7表示最终网格的大小
- (SS)(B*5+C)

损失函数:
NMS(非极大值抑制)

YOLO1总结:
优点:快速,简单!
问题1:每个Cell只预测一个类别,如果重叠无法解决
问题2:小物体检测效果一般,长宽比可选的但单一
