YOLOv8算法改进【NO.100】引入最新发布AKConv

发布时间:2024年01月24日

?前? ?言
? ? ? ?YOLO算法改进系列出到这,很多朋友问改进如何选择是最佳的,下面我就根据个人多年的写作发文章以及指导发文章的经验来看,按照优先顺序进行排序讲解YOLO算法改进方法的顺序选择。具体有需求的同学可以私信我沟通:

第一,创新主干特征提取网络,将整个Backbone改进为其他的网络,比如这篇文章中的整个方法,直接将Backbone替换掉,理由是这种改进如果有效果,那么改进点就很值得写,不算是堆积木那种,也可以说是一种新的算法,所以做实验的话建议朋友们优先尝试这种改法。

第二,创新特征融合网络,这个同理第一,比如将原yolo算法PANet结构改进为Bifpn等。

第三,改进主干特征提取网络,就是类似加个注意力机制等。根据个人实验情况来说,这种改进有时候很难有较大的检测效果的提升,乱加反而降低了特征提取能力导致mAP下降,需要有技巧的添加。

第四,改进特征融合网络,理由、方法等同上。

第五,改进检测头,更换检测头这种也算个大的改进点。

第六,改进损失函数,nms、框等,要是有提升检测效果的话,算是一个小的改进点,也可以凑字数。

第七,对图像输入做改进,改进数据增强方法等。

第八,剪枝以及蒸馏等,这种用于特定的任务,比如轻量化检测等,但是这种会带来精度的下降。

...........未完待续

一、创新改进思路或解决的问题

强势推出 Deformable Convolution v4 (DCNv4),这是一种专为广泛的视觉应用而设计的高效且有效的动态和稀疏的算子。

二、基本原理

原文链接:?[2311.11587] AKConv: Convolutional Kernel with Arbitrary Sampled Shapes and Arbitrary Number of Parameters (arxiv.org)[2311.11587] AKConv: Convolutional Kernel with Arbitrary Sampled Shapes and Arbitrary Number of Parameters (arxiv.org)

??摘要:基于卷积运算的神经网络在深度学习领域取得了显著的成果,但标准卷积运算存在两个固有缺陷。一方面,卷积运算局限于局部窗口,无法从其他位置捕获信息,并且其采样形状是固定的。另一方面,卷积核的大小固定为k×k,这是一个固定的正方形形状,并且参数的数量倾向于随大小成直角增长。很明显,在不同的数据集和不同的位置,目标的形状和大小是不同的。具有固定样本形状和正方形的卷积核不能很好地适应变化的目标。针对上述问题,本工作探讨了可变核卷积(AKConv),它为卷积核提供了任意数量的参数和任意采样形状,为网络开销和性能之间的权衡提供了更丰富的选择。在AKConv中,我们通过一种新的坐标生成算法定义了任意大小卷积核的初始位置。为了适应目标的变化,我们引入偏移来调整每个位置的样本形状。此外,我们还通过使用具有相同大小和不同初始采样形状的AKConv来探索神经网络的效果。AKConv通过不规则卷积运算完成了高效特征提取的过程,并为卷积采样形状带来了更多的探索选择。在代表性数据集COCO2017、VOC 7+12和VisDrone-DET2021上的目标检测实验充分展示了AKConv的优势。AKConv可以用作即插即用卷积运算,以取代卷积运算,从而提高网络性能。

三、?添加方法

部分代码如下所示,详细改进代码可私信我获取。(扣扣2453038530)

四、总结

预告一下:下一篇内容将继续分享深度学习算法相关改进方法。有兴趣的朋友可以关注一下我,有问题可以留言或者私聊我哦

PS:该方法不仅仅是适用改进YOLOv8,也可以改进其他的YOLO网络以及目标检测网络,比如YOLOv7、v6、v4、v3,Faster rcnn ,ssd等。

最后,有需要的请关注私信我吧。关注免费领取深度学习算法学习资料!
文章来源:https://blog.csdn.net/m0_70388905/article/details/135821038
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。