Obtect Detection,物体检测10年的发展,物体检测历史最佳网络

发布时间:2024年01月05日

一阶段目标检测网络

1. AlexNet (2012)
  • 基本流程: 作为深度学习在图像识别中的突破性应用,AlexNet主要用于图像分类,而非目标检测。但它奠定了现代深度学习网络的基础。
  • 基本原理: 使用卷积神经网络(CNN)来提取图像特征,并通过多层网络进行分类。
  • 改进之处: 相对于传统方法,AlexNet通过ReLU激活函数、Dropout和数据增强提高了性能和泛化能力。
  • 特别之处: 引入了深层网络和GPU加速计算。
  • 主要网络结构: 5层卷积层,3层全连接层。
  • 基本简介: 标志着深度学习时代的开始,对后续的目标检测网络产生了深远影响。
2. YOLO (You Only Look Once, 2015)
  • 基本流程: 将目标检测视为一个回归问题,直接在图像上预测边界框和类别。
  • 基本原理: 将图像分割成多个格子,每个格子负责预测中心点落在该格子内的对象。
  • 改进之处: 实现了快速、实时的目标检测。
  • 特别之处: 强调速度和简便性,牺牲了一定的准确性。
  • 主要网络结构: 单个卷积神经网络直接进行预测。
  • 基本简介: 开创了一阶段目标检测的先河,突出特点是速度快。
3. RetinaNet (2016)
  • 基本流程: 同时进行特征金字塔结构的构建和目标检测。
  • 基本原理: 引入焦点损失(Focal Loss)来解决类别不平衡问题。
  • 改进之处: 提高了小目标的检测精度。
  • 特别之处: 焦点损失在处理易分类和难分类样本时表现出色。
  • 主要网络结构: 特征金字塔网络(FPN)和ResNet。
  • 基本简介: 在保持速度的同时提高了检测精度,特别是在小目标上。
4. CornerNet (2018)
  • 基本流程: 通过检测目标边界框的角点来定位和识别目标。
  • 基本原理: 使用卷积神经网络同时预测物体的左上角和右下角。
  • 改进之处: 消除了传统锚框(anchor boxes)的需要。
  • 特别之处: 采用了角点配对来定义边界框。
  • 主要网络结构: 基于深层卷积神经网络,使用了多尺度特征图。
  • 基本简介: 提供了一种创新的无锚框目标检测方法。
5. CenterNet (2019)
  • 基本流程: 通过预测物体中心点及其大小来检测目标。
  • 基本原理: 定位目标的中心,并回归到其宽高。
  • 改进之处: 简化了检测流程,减少了计算量。
  • 特别之处: 强调中心点的检测,而非传统的边界框。
  • 主要网络结构: 依赖于密集的预

测和中心点回归。

  • 基本简介: 以简洁的方式实现了有效的目标检测。
6. DETR (2020)
  • 基本流程: 结合了CNN和Transformer结构,直接输出物体的类别和边界框。
  • 基本原理: 使用Transformer处理图像特征,实现了端到端的目标检测。
  • 改进之处: 引入Transformer提高了模型的表达能力。
  • 特别之处: 去除了传统的NMS(非最大抑制)步骤。
  • 主要网络结构: CNN和Transformer。
  • 基本简介: 是第一个成功应用Transformer到目标检测的尝试。

二阶段目标检测网络

1. R-CNN (2014)
  • 基本流程: 先从图像中提取候选区域,再对每个区域进行分类和边界框回归。
  • 基本原理: 结合区域提议(region proposal)和CNN。
  • 改进之处: 显著提高了检测精度。
  • 特别之处: 引入了深度学习到传统的目标检测流程中。
  • 主要网络结构: CNN用于特征提取,后接分类器和回归器。
  • 基本简介: 开创了深度学习在目标检测中的应用,尽管速度较慢。
2. SPPNet (Spatial Pyramid Pooling, 2014)
  • 基本流程: 在CNN顶部引入空间金字塔池化层,以处理不同尺寸的输入。
  • 基本原理: 通过空间金字塔池化使网络能够接受任意大小的输入。
  • 改进之处: 解决了固定输入大小的限制。
  • 特别之处: 增强了网络处理不同尺度特征的能力。
  • 主要网络结构: CNN加上空间金字塔池化层。
  • 基本简介: 提高了灵活性和适应性,尤其在处理不同尺寸的图像时。
3. Fast R-CNN (2015)
  • 基本流程: 结合了R-CNN的优点和SPPNet的创新,提高了速度和效率。
  • 基本原理: 使用RoI(Region of Interest)池化层来共享计算。
  • 改进之处: 大幅提高了训练和测试速度。
  • 特别之处: 通过共享特征计算,减少了重复的工作。
  • 主要网络结构: CNN与RoI池化层。
  • 基本简介: 是R-CNN的一个有效改进,平衡了速度和精度。
4. FPN (Feature Pyramid Networks, 2017)
  • 基本流程: 通过构建一个高低分辨率特征的金字塔,实现了多尺度目标检测。
  • 基本原理: 利用不同层次的特征图进行目标检测。
  • 改进之处: 提高了对不同尺度目标的检测能力。
  • 特别之处: 结合了底层的细节信息和高层的语义信息。
  • 主要网络结构: 多尺度特征融合。
  • 基本简介: 在处理多尺度目标时表现出色,特别是在检测小目标方面。

这些网络各有特点,共同推动了目标检测技术的发展。一阶段网络注重速度和简化流程,而二阶段网络则侧重于提高检测精度。随着时间的推移,这些网络在性

能和效率上不断优化,为计算机视觉领域带来了重大进步。

文章来源:https://blog.csdn.net/weixin_50592077/article/details/135413535
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。