笔记1:基于锚框（先验框）的目标检测

发布时间：2023年12月29日

一、边缘框（bounding box）

1.1 定义

边缘框：真实标注的物体位置

2.1 表示方式

1、（x1,y1)和(x2,y2)
2、（x1,y1)和w,h
在这里插入图片描述

二、锚框(anchor box)/先验框（prior bounding box）

2.1 定义

对边缘框的预测

2.2 预测方式

一般很难直接通过坐标数据预测边缘框，通常采用多个边缘框，当包含目标时，再慢慢调整。
第一步：判断是否包含感兴趣目标(目标类别）
第二步：预测锚框到真实边缘框的偏移（目标位置）
在这里插入图片描述
s是缩放比，r是宽高比

2.2.1 IOU 交并比

比较两个框之间的相似度
在这里插入图片描述
0表示没有重叠，1表示完全重合。

2.2.2 赋予锚框标号

在这里插入图片描述
每个锚框都是1个训练样本（训练框）
锚框有2种属性，1是背景，即为负样本；2是关联边缘框，即为正样本
通常训练中我们会生成大量锚框，在这大量的锚框中，负样本居多
值得注意的是：
1、锚框生成要么是固定生成，要么是根据图片生成；而边缘框是提前标号的真实框，存好的标注
2、赋予锚框编号的过程是每次读入图片后都要进行1次的操作
3、赋予锚框编号的算法有很多种，这其实常见的其中一种。

三、非极大抑制输出（NMS）

目的：1个边缘框对应1个锚框
NMS作用：合并相似的预测
在这里插入图片描述

比如dog类的3个预测框中，最大的是0.9，那么第一步选择这个框，第二步计算dog=0.8、dog=0.7这2个框与dog=0.9的这个框的Iou值，如大于我们规定的值，去掉；cat是另外的类，不影响dog类的NMS;第3步，计算下一个类别的最大预测框，重复上述步骤。

四、总结

一类目标检测算法基于锚框来预测
首先生成大量锚框，并赋予标号，每个锚框作为一个样本进行训练
在预测时，使用NMS来去掉冗余的预测。

文章来源:https://blog.csdn.net/weixin_46468790/article/details/135239957
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！