网络结构
Input
Backbone
Backbone**:**在不同图像细粒度上聚合并形成图像特征的卷积神经网络。
Neck
Neck**:**一系列混合和组合图像特征的网络层,并将图像特征传递到预测层。
Head
Head**:**对图像特征进行预测,生成边界框和并预测类别。
数据增强
基于输入的图片
- Random erasing data augmentation :https://arxiv.org/abs/1708.04896
- Improved Regularization of Convolutional Neural Networks with Cutout:https://arxiv.org/abs/1708.04552
基于特征图
https://zhuanlan.zhihu.com/p/136115652