【YOLO系列】yolo V1 ，V3，V5，V8 解释

发布时间：2023年12月30日

文章目录

yolo V1 模型结构图
yolo V3
yolo V5
yolo V8

视频来源：https://www.bilibili.com/video/BV13K411t7Zs/

AI视频小助理
一、YOLO系列的目标检测算法，其中详细讲解了U6V1的网络结构，包括卷积层、池化层、通道数等基础知识。
00:01 - 介绍YOLO系列的目标检测算法
01:36 - 详细介绍yolo V1的网络结构，包括卷积层和池化层
05:17 - 解释通道数的意思和物理意义，以及卷积神经网络中的卷积核和通道数的关系
二、卷积神经网络的基本概念和结构，以及如何通过网络输出预测图像中的目标检测结果，详细解释了网络中各个参数的意义。
06:15 - 192个卷积核对应192个特征，对应原图表达。
07:18 - 特征图通道数为1024，经过4096全连接后转化为输出形状77×30。
08:22 - 输出结果为774×30的数字向量，每个数字代表原图小格子的预测结果。
三、目标检测模型的预测过程和输出结果，以及该模型的损失函数设计。其中，置信度和类别概率等概念被提及。
12:29 - 每个格子预测两个物体，但大量的预测是背景。
14:29 - 每个格子的置信度代表该位置是物体的概率。
17:46 - YOLO的损失函数包含四个加号，其中第一个加号涉及到数学计算。
四、YOLO系列算法中的损失函数，包括中心坐标、宽高等预测结果的调整以及置信度的拟合，最后还介绍了YOLOv3的复杂结构和计算方法。
18:43 - 损失函数中加入中心坐标点，使其越来越准确
19:38 - 损失函数中加入宽高拟合，让预测结果与真实结果越接近越好
23:53 - YOLO v3模型有三个通路，经过卷积、批量归一化和激活函数处理
五、CBL、RESNET等深度学习中的小零件，以及这些零件如何拼接成复杂的结构，从而提取不同尺寸的信息，提高预测效果。
24:56 - CBL、卷积、批量规划、激活函数等深度学习小零件的拼接搭建整个网络结构。
26:40 - 不同尺寸信息提取可以提高预测效果，V3、V5、V8结构设计相似，但V8使用了更新数据进行训练。
28:56 - yolo V5和V8的网络结构复杂，越靠近输入层获取到的特征越细节，越靠上的特征越宏观。
–本内容由AI视频小助理生成，关注解锁AI助理，由@Triticale21 召唤发送

yolo V1 模型结构图

在这里插入图片描述

通道数的物理意义是什么？

每一个通道都是由 1个卷积核经过卷积运算获得的输出结果
192个通道对应 192个卷积核，这192个卷积核在训练过程中彼此独立，参数都是各自更新的，所以这192个卷积核可以看作是 192个小特征！

输出 7×7×30 怎么理解？

只要物体的中心点落在这个格子内，就交给这个格子来预测！

每个格子要预测两个物体，所以有两份 xywhc，xywhc，c 是置信度，20是类别概率

在这里插入图片描述

YOLO v1 损失函数LOSS

理解意义
在这里插入图片描述

yolo V3

理解：提取不同尺寸信息，让yolo 适用于大尺寸的物体和小尺寸的物体

越靠近输入，特征越细节；
越靠近输出，特征越宏观，越具体（高层语义）

在这里插入图片描述

yolo V5

模型更复杂了，但还是3个分支
在这里插入图片描述

yolo V8

这个输出是 3分支检测吗？【有点像自己任务想的输出了？】
在这里插入图片描述

文章来源:https://blog.csdn.net/weixin_43154149/article/details/135307295
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！

【YOLO系列】yolo V1 ，V3，V5，V8 解释

文章目录

yolo V1 模型结构图

通道数 的 物理意义是什么？

输出 7×7×30 怎么理解？

YOLO v1 损失函数LOSS

yolo V3

yolo V5

yolo V8

通道数的物理意义是什么？