SPP Net:Spatial Pyramid Pooling Net(空间金字塔池化网络)
SPP-Net是出自何凯明教授于2015年发表在IEEE上的论文-《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》
前文目标检测-Two Stage-RCNN中提到RCNN的主要缺点如下:
SPP Net 针对上述缺点做了改进
提示:以下是本篇文章正文内容,下面内容可供参考
ps:输入影像大小可以是任意的,因此feature map的大小也是任意的
ps:以下图举例来说,SPP以3级空间金字塔(4×4,2×2,1×1)来提取特征,就可以得到16+4+1=21种不同的块(Spatial bins),对每个块进行池化操作,最终得到固定大小为21×256的输出
实际使用了4级空间金字塔(1×1, 2×2, 3×3, 6×6),这会为每个候选窗口生成12800d(256×50)的表示
ps:输入的大小可以是任意的,使得网络可用于多尺度训练
尽管相比于RCNN,SPP Net提高了精度和速度,但是仍然是分开训练多个模型,模型训练难度大且繁杂。
尽管比RCNN快10-100倍,但仍然很慢
SPP Net无法更新空间金字塔池化层以下的权重,根本原因是,当每个训练样本来自不同影像时,通过SPP层的反向传播效率很低