proposal也可以叫roi。
解码decode将真实框同回归分支预测出的anchor的偏移量来得到预测预测框。
clip将预测框的位置限制在图片的范围内。
直到clip这一步还保留全部的预测框结果。
这一步是对预测框进行过滤。
首先把面积太小的过滤掉。
第二步把分数过低的过滤掉。
第三步是去掉接近的预测框。
第四步又是把分数过低的过滤掉。
resolution表示期盼的输出特征图大小,这里也就是下面的22。
上面151288中的1代表的是图片的个数。
下面15122*2中的1代表的是roi的个数。
bbox head即检测头。
为了保证正样本存在,在采样的过程中,roi和真实框会共同参与采样,这样采样的结果可能包含真实框。