英文论文(sci)解读复现【NO.21】一种基于空间坐标的轻量级目标检测器无人机航空图像的自注意

news/2024/7/10 2:54:14 标签: YOLO, 目标检测, 人工智能
此前出了目标检测算法改进专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读发表高水平学术期刊中的 SCI论文,并对相应的SCI期刊进行介绍,帮助大家解答疑惑,助力科研论文投稿。解读的系列文章,本人会进行 创新点代码复现,有需要的朋友可关注私信我获取。

一、摘要

目标检测是众多无人驾驶最广泛的应用之一飞行器(UAV)任务。由于无人机的拍摄角度和飞行高度,与一般情况下,小物体在航空图像中占很大比例,而普通物体探测器在航空图像中不是非常有效。此外,由于的计算资源无人机平台通常是有限的,普通探测器的部署有大量无人机平台上的参数很难确定。本文提出了一种轻量级的对象检测器YOLOUAVlite用于航空图像。首先,空间注意力模块和坐标注意力模块是修改并组合形成一个新的空间坐标自注意(SCSA)模块,该模块集成空间、位置和通道信息以增强对象表示。关于这个在此基础上,我们构建了一个名为CSAshuffleenet的轻量级主干,它结合了增强型Shuf fle eNet(ES)网络,具有拟议的SCSA模式。关于这个在此基础上,我们构建了一个名为SCSAshuf fleenet的轻量级主干,它结合了增强型Shuf fle eNet(ES)网络,具有拟议的SCSA模块,以改进特征提取并减少模型大小。其次,我们提出了一种改进的特征金字塔模型,即Slim-BiFPN,其中我们构造了新的轻量级卷积块,以减少特征过程中的信息损失地图融合过程,同时减少模型权重。最后,定位损失函数为改进以提高边界框回归率,同时提高定位精度。在VisDrone-DET2021数据集上进行的大量实验表明,与YOLOv5-N基线,所提出的YOLO UAVlite将参数数量减少了25.8%,并且在mAP0.50中实现了10.9%的增益。与其他轻质探测器相比,mAP和改进了参数的数量。

二、网络模型及核心创新点

三、实验效果(部分展示)

五、实验结论

在这项研究中,提出了一种轻型探测器YOLO UAVlite来应对这一挑战航空图像中的小规模物体检测。网络结构基于在YOLOv5-N算法上,提高了对小物体的检测效果。我们修改空间和坐标的注意力,并结合它们的优势产生新的注意力,称为SCSA,它将空间、位置和通道信息集成到增强对象表示。我们提出了一个基于SACA的骨干网络ES。改进后的主干网大大提高了检测性能,尤其是对
小物体。所提出的Slim BiFPN大大简化了网络,并且SCSA对模块进行了融合,减少了信息丢失,避免了精度损失。最后,我们扩展通过优化损耗来减少小物体的损耗作用。

注:论文原文出自A Lightweight Object Detector Based on Spatial-Coordinate Self-Attention for UAV Aerial Images 本文仅用于学术分享,如有侵权,请联系后台作删文处理。

解读的系列文章,本人已进行创新点代码复现,有需要的朋友欢迎关注私信我获取

http://www.niftyadmin.cn/n/5380694.html

相关文章

【HarmonyOS】鸿蒙Arkts开发从入门到实战【持续更新】

鸿蒙Arkts开发从入门到实战目录 1. 工具安装 ArkTs 2.1 基础语法 2.2 状态管理 2.3 渲染控制 2.4 页面路由 ArkUI的基础类组件使用 3.1 Image组件 3.2 Text组件 3.3 TextInput组件 3.4 Button组件 3.5 Slider组件 3.6 Video组件 3.7 自定义组件 3.8 气泡提示 3.9 菜单 Stage模…

Java解决石子游戏问题

Java解决石子游戏问题 01 题目 Alice 和 Bob 用几堆石子在做游戏。一共有偶数堆石子,排成一行;每堆都有 正 整数颗石子,数目为 piles[i] 。 游戏以谁手中的石子最多来决出胜负。石子的 总数 是 奇数 ,所以没有平局。 Alice 和…

AST混淆与解混淆笔记:逗号表达式混淆

本文主要是作者记笔记为主,温故而知新,记录混淆和解混淆的代码,后期可能会更新文章细节 以以下代码为例: function test(a, b){const c "123";a a 1 // aa a 2a a * 1234a a.toString()a a.substring(0, 3)b …

【JavaEE】_HTTP请求首行

目录 1. URL 2. 方法 2.1 GET方法 2.2 POST方法 2.3 GET与POST的区别 2.4 低频使用方法 1. URL 在mysql JDBC中已经提到过URL的相关概念: 如需查看有关JDBC更多内容,原文链接如下: 【MySQL】_JDBC编程-CSDN博客 URL用于描述某个资源…

数据结构与算法:二叉树

一、二叉树的链式存储 树结点数据结构 typedef char BiElemType; typedef struct BiTNode{BiElemType c;struct BiTNode *lchild;struct BiTNode *rchild; }BiTNode,*BiTree;树中任何一个结点都是一个结构体,它的空间是通过malloc申请出来的 二、二叉树层次建树 …

分享一个学英语的网站

名字叫:公益大米网​​​​​​​ Freerice 这个网站是以做题的形式来记忆单词,题干是一个单词,给出4个选项,需要选出其中最接近题干单词的选项。 答对可以获得10粒大米,网站的创办者负责捐赠。如图 触发某些条件&a…

【Qt】图形视图框架 之 坐标

QGraphicsView移动图元/场景以及坐标转换 QGraphicsView图形视图框架使用(一)坐标变换 1.继承 QGraphicsProxyWidget 类 虚函数 mousePressEvent、mouseReleaseEvent 的参数 QGraphicsSceneMouseEvent event->pos() 是item坐标系*下的坐标,不是scene场景坐标系下…

模型可视化

模型标题可视化 可视化工具:Graphiz、Netron、ZetaneEngine 7.2.2Graphiz可视化工具 Graphiz是一个由AT&T实验室启动的开源工具包,用于绘制DOT语言脚本描述的图形,使用它可以非常方便地对任何图形进行可视化。 Graphiz的使用步骤包括创…