crop size

图片预处理-裁剪的大小

深度学习图片预处理:crop caffe中使用crop_size剪裁训练图片 crop_size是对训练集图像进行裁剪,是对原始的训练集图像进行处理。如果原始训练图像的尺寸大小为800800,crop_size的图片为600600,则crop_size的图片为800*800的图像集。

在深度学习中,经常需要将输入图片进行裁剪,转换为网络输入的图片height和width。如果直接将图片进行resize,可能使得图片中的bbox变形。因此需要对原图进行扩展之后,以原图的bbox中心作为输出图的中心,按照image.png的大小进行裁剪,然后再resize到[height,width]进行输出。这样裁剪的好处是可以使得bbox不会变形。

downsample_ratio

特征图的下采样比例,例如P0是32,P1是16,P2是8。https://blog.csdn.net/qq_37099552/article/details/108291463

SOTA模型

参考资料:

15大领域、127个任务,这里有最全的机器学习SOTA模型 - 机器之心的文章 - 知乎

概念解释:

SOTA,全称「state-of-the-art」,用于描述机器学习中取得某个任务上当前最优效果的模型。例如在图像分类任务上,某个模型在常用的数据集(如 ImageNet)上取得了当前最优的性能表现,我们就可以说这个模型达到了 SOTA。

SOTA模型现有的整理:

机器之心SOTA 机器之心-人群计数SOTA合集(按条件搜索出的) paperwithcode上听说也有SOTA 可以根据想要的领域查询 image.png image.png 查询我的任务“人群计数” image.png image.png