Obtect Detection，物体检测10年的发展，物体检测历史最佳网络

发布时间：2024年01月05日

一阶段目标检测网络

1. AlexNet (2012)

基本流程: 作为深度学习在图像识别中的突破性应用，AlexNet主要用于图像分类，而非目标检测。但它奠定了现代深度学习网络的基础。
基本原理: 使用卷积神经网络（CNN）来提取图像特征，并通过多层网络进行分类。
改进之处: 相对于传统方法，AlexNet通过ReLU激活函数、Dropout和数据增强提高了性能和泛化能力。
特别之处: 引入了深层网络和GPU加速计算。
主要网络结构: 5层卷积层，3层全连接层。
基本简介: 标志着深度学习时代的开始，对后续的目标检测网络产生了深远影响。

2. YOLO (You Only Look Once, 2015)

基本流程: 将目标检测视为一个回归问题，直接在图像上预测边界框和类别。
基本原理: 将图像分割成多个格子，每个格子负责预测中心点落在该格子内的对象。
改进之处: 实现了快速、实时的目标检测。
特别之处: 强调速度和简便性，牺牲了一定的准确性。
主要网络结构: 单个卷积神经网络直接进行预测。
基本简介: 开创了一阶段目标检测的先河，突出特点是速度快。

3. RetinaNet (2016)

基本流程: 同时进行特征金字塔结构的构建和目标检测。
基本原理: 引入焦点损失（Focal Loss）来解决类别不平衡问题。
改进之处: 提高了小目标的检测精度。
特别之处: 焦点损失在处理易分类和难分类样本时表现出色。
主要网络结构: 特征金字塔网络（FPN）和ResNet。
基本简介: 在保持速度的同时提高了检测精度，特别是在小目标上。

4. CornerNet (2018)

基本流程: 通过检测目标边界框的角点来定位和识别目标。
基本原理: 使用卷积神经网络同时预测物体的左上角和右下角。
改进之处: 消除了传统锚框（anchor boxes）的需要。
特别之处: 采用了角点配对来定义边界框。
主要网络结构: 基于深层卷积神经网络，使用了多尺度特征图。
基本简介: 提供了一种创新的无锚框目标检测方法。

5. CenterNet (2019)

基本流程: 通过预测物体中心点及其大小来检测目标。
基本原理: 定位目标的中心，并回归到其宽高。
改进之处: 简化了检测流程，减少了计算量。
特别之处: 强调中心点的检测，而非传统的边界框。
主要网络结构: 依赖于密集的预

测和中心点回归。

基本简介: 以简洁的方式实现了有效的目标检测。

6. DETR (2020)

基本流程: 结合了CNN和Transformer结构，直接输出物体的类别和边界框。
基本原理: 使用Transformer处理图像特征，实现了端到端的目标检测。
改进之处: 引入Transformer提高了模型的表达能力。
特别之处: 去除了传统的NMS（非最大抑制）步骤。
主要网络结构: CNN和Transformer。
基本简介: 是第一个成功应用Transformer到目标检测的尝试。

二阶段目标检测网络

1. R-CNN (2014)

基本流程: 先从图像中提取候选区域，再对每个区域进行分类和边界框回归。
基本原理: 结合区域提议（region proposal）和CNN。
改进之处: 显著提高了检测精度。
特别之处: 引入了深度学习到传统的目标检测流程中。
主要网络结构: CNN用于特征提取，后接分类器和回归器。
基本简介: 开创了深度学习在目标检测中的应用，尽管速度较慢。

2. SPPNet (Spatial Pyramid Pooling, 2014)

基本流程: 在CNN顶部引入空间金字塔池化层，以处理不同尺寸的输入。
基本原理: 通过空间金字塔池化使网络能够接受任意大小的输入。
改进之处: 解决了固定输入大小的限制。
特别之处: 增强了网络处理不同尺度特征的能力。
主要网络结构: CNN加上空间金字塔池化层。
基本简介: 提高了灵活性和适应性，尤其在处理不同尺寸的图像时。

3. Fast R-CNN (2015)

基本流程: 结合了R-CNN的优点和SPPNet的创新，提高了速度和效率。
基本原理: 使用RoI（Region of Interest）池化层来共享计算。
改进之处: 大幅提高了训练和测试速度。
特别之处: 通过共享特征计算，减少了重复的工作。
主要网络结构: CNN与RoI池化层。
基本简介: 是R-CNN的一个有效改进，平衡了速度和精度。

4. FPN (Feature Pyramid Networks, 2017)

基本流程: 通过构建一个高低分辨率特征的金字塔，实现了多尺度目标检测。
基本原理: 利用不同层次的特征图进行目标检测。
改进之处: 提高了对不同尺度目标的检测能力。
特别之处: 结合了底层的细节信息和高层的语义信息。
主要网络结构: 多尺度特征融合。
基本简介: 在处理多尺度目标时表现出色，特别是在检测小目标方面。

这些网络各有特点，共同推动了目标检测技术的发展。一阶段网络注重速度和简化流程，而二阶段网络则侧重于提高检测精度。随着时间的推移，这些网络在性

能和效率上不断优化，为计算机视觉领域带来了重大进步。

文章来源:https://blog.csdn.net/weixin_50592077/article/details/135413535
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！