论文地址:SSD: Single Shot MultiBox Detector
单一深度神经网络用于对象检测:SSD方法使用一个单一的深度神经网络来直接检测图像中的对象,这与传统的需要先生成 对象提议(区域提议)再进行分类的方法不同。(传统的目标检测网络是”Two Stage“算法,SSD 是”One Stage“算法)
离散化的输出空间:SSD通过将边界框(Bounding Boxes)的输出空间离散化为一组宽高比和尺度的默认框,来实现对对象的检测。
离散化的输出空间理解:
- ”连续化“的输出空间:对于传统的目标检测算法,生成的候选框其实是不确定的,是以选择性搜索(Selective Search)方法或者RPN网络计算得出的,这些候选框可能生成任何位置,任何大小,任何尺寸(有无限种可能),因此基于这些框的预测输出也就是”连续化“的输出空间。
- ”离散化“的输出空间:对于SSD算法,生成的候选框是确定的,是预先定义好的,在图像的什么位置、什么大小、什么尺寸,这些都是以及定义好的,不需要使用候选框生成算法来生成(有限种可能),因此基于这些框的预测输出也就是”离散化“的输出空间。
SSD模型
多尺度特征图和卷积预测器
默认框和宽高比
训练
这篇论文《SSD: Single Shot MultiBox Detector》的主要创新点和贡献可以总结如下:
以上内容旨在记录自己的学习过程以及复习,如有错误,欢迎批评指正,谢谢阅读。