先放总结:
把图像划分成网格,图像经过卷积网络筛选和融合特征后的特征图中的每个单元对应原图每个网格单元,给每个特征单元用1x1卷积替代全连接做回归预测,就能知道原图对应网格可能是什么东西在哪个位置,,划分网格和anchor都是一种限制或者说叫经验排除一些不可能的因素,这会缩小变化空间,从而提升回归预测的准确率,最后利用nms筛选结果。
一、引言
目标分类———>目标检测
目标分类:1图片—-1结果
目标检测:1图片—-n结果
二、Yolo原理
把图像划分成网格
明白真实值如何编码
小格填小数
目标分三类:warrior,master,boss
bs:输入的图片数
回归方法:
sigmod函数,在0-1作回归,即小数部分做回归。
bx,by 真实框的坐标
cx,cy (int)格子坐标的索引
剩下的是卷积神经网络的输出。
“巨人的肩膀上作回归”
x,y 向下取整
w,h 锚点,锚框,kmeans聚类,算交并比,与阈值作比较
