摘要
论文链接:https://arxiv.org/pdf/2303.09030.pdf
最近关于遥感目标检测的研究主要集中在改进有向边界框的表示,但忽略了遥感场景中呈现的独特先验知识。这种先验知识很有用,因为如果没有参考足够远的上下文,可能会错误地检测到微小的遥感对象,而不同类型对象所需的远程上下文可能会有所不同。在本文中,我们考虑了这些先验,并提出了大选择性核网络(LSKNet)。LSKNet可以动态调整其大的空间感受野,以更好地模拟遥感场景中各种对象的测距上下文。据我们所知,这是第一次在遥感目标检测领域探索大和选择性核机制。LSKNet在标准基准上创造了新的最先进得分,即HRSC2016(98.46%mAP)、DOTA-v1.0(81.85%mAP)和FAIR1M-v1.0(47.87%mAP)。基于类似的技术,我们在2022年大湾区国际算法竞赛中排名第二。代码可在https://github.com/zcablii/Large-Selective-Kernel-Network获取。
简介
遥感目标检测【75】是计算机视觉的一个领域,专注于在航空图像中识别和定位感兴趣的物体,如车辆或飞机。近年来,一个主流趋势是生成准确符合被检测物体方向的边界框,而不是简单地在它们周围绘制水平框。因此,大量的研究集中在改进遥感目标检测中有向边界框的表示。这主要是通过开发专门的检测框架实现的,如RoI Transformer【12】、Oriented R-CNN【62】和R3Det【68】,以及有向框编码技术,如滑动顶点【64】和中点偏移框编码【62】。此外,还提出了许多损失函数,包括GWD【70】、KLD【72】和调制损失【50】,以