Faster R-CNN

发布时间:2024年01月04日

Faster R-CNN流程图

  • 相较于R-CNN与Fast R-CNN而言,其采用了RPN去代替之前的SS算法去生成候选区域。
  • 当生成候选区域后进行的仍然和Fast R-CNN一样的操作(Rol pooling -> FC ->softmax & 边界框预测)。

RPN

在特征图上采用3x3卷积,padding=1,dilation=1

这里cls layer是进行的卷积,2k个大小1x1的卷积核进行处理,reg layer则是4k个大小为1x1的卷积核进行处理。

  • 对于一张1000x600x3的图像,大约有60x40x9(20k)个anchor,忽略跨越边界的anchor以后,剩下约6k个anchor。对于RPN生成的候选框之间存在大量重叠,基于候选框的cls得分,采用非极大值抑制,IoU设为0.7,这样每张图片只剩2k个候选框。
  • 训练数据的采样,即正样本和负样本的选择,方式一根据与GT box 的IoU的阈值来确定一般阈值为0.7、方式二是GT box与所以有重叠的生成的预选框中最大的IoU的预选框被认为是正样本。

RPN的损失函数

分类损失

  • 对应分类损失,有两种说法一种是多类别交叉熵损失、另一个是二分类交叉熵损失?。

?

边界框回归

和Fast R-CNN的边界框损失一样的

?Faster R-CNN训练

Faster R-CNN框架

?

总结:

在Fast R-CNN基础上进一步合并,将原先的SS算法生成候选区域改为RPN网络生成,加快了候选区域的生成速度,其余和Fast R-CNN一样。

文章来源:https://blog.csdn.net/qq_55414382/article/details/135396555
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。