YOLO-V1

    • 经典的one-stage方法
    • You Only Look Once,名字就已经说明了一切!
    • 把检测问题转化成回归问题,一个CNN就搞定了!
    • 可以对视频进行实时检测,应用领域非常广!

    image.png

    核心思想:

    image.png
    网络架构:
    输入一个448x448x3的图像,进行卷积,得到一个7x7x1024的特征图
    image.png

    每个数字的含义:

    • 10 =(X,Y,H,W,C)*B(2个)
    • 当前数据集中有20个类别
    • 7*7表示最终网格的大小
    • (SS)(B*5+C)

    image.png

    损失函数:
    image.png
    NMS(非极大值抑制)

    image.png
    YOLO1总结:
    优点:快速,简单!
    问题1:每个Cell只预测一个类别,如果重叠无法解决
    问题2:小物体检测效果一般,长宽比可选的但单一