Oriented R-CNN:面向旋转目标检测的 R-CNN(ICCV2021)

news/2024/7/10 2:06:38 标签: 目标检测, 旋转目标检测, 计算机视觉

Oriented R-CNN:面向旋转目标检测的 R-CNN(ICCV2021)

  • 一. 旋转目标检测——研究现状
      • 1.1. 之前的算法
      • 1.2. 旋转目标检测——数据集
      • 1.3. 开源代码
  • 二. 《Oriented R-CNN for Object Detection》文章简介
  • 三. 《Oriented R-CNN for Object Detection》文章详解
  • 四. 实验结果

论文链接:《Oriented R-CNN for Object Detection》
代码链接:https://github.com/jbwang1997/OBBDetection

本文提出一种通用的两阶段旋转目标检测器,具有良好的准确性和效率,表现SOTA!性能优于Mask OBBSCRDet等网络,代码现已开源!作者单位:西北工业大学

    前言:文章是旋转目标检测的新作,旋转目标检测作为近几年被认可的研究领域(之前没有相关数据集,审稿人也不是很认可)
    所以,有必要先介绍一下旋转目标检测的研究现状和数据集,不需要的同学可以跳过

一. 旋转目标检测——研究现状

1.1. 之前的算法

在这里插入图片描述

图1. DOTA旋转目标赛道实时排名(2019年12-22)
  • 旋转目标(遥感/文字)检测方法整理(2017-19年)
  • 旋转目标检测方法解读 (Gliding Vertex, TPAMI、RSDet, AAAI21)
  • 旋转目标检测方法解读(KLD)
  • 旋转目标检测方法解读 (SCRDet, ICCV2019)

1.2. 旋转目标检测——数据集

在这里插入图片描述

  • 多半都是遥感目标检测相关:

  • 也有少部分物体的:

    • DRN:用于旋转和密集目标检测的动态优化网络
      • 论文下载链接:https://arxiv.org/abs/2005.09973
      • 代码和数据集 :https://github.com/Anymake/DRN_CVPR2020
        在这里插入图片描述

1.3. 开源代码

  • https://github.com/SJTU-Thinklab-Det/DOTA-DOAI

二. 《Oriented R-CNN for Object Detection》文章简介

    当前最先进的两级检测器通过耗时的方案生成定向建议。这降低了检测器的速度,从而成为先进的面向对象检测系统的计算瓶颈。
    这项工作提出了一种有效且简单的面向对象检测框架,称为 Oriented R-CNN,它是一种通用的两阶段面向检测器,具有良好的准确性和效率。
    具体来说,在第一阶段,我们提出了一个面向区域提案网络(orientation RPN),它以几乎免费的方式直接生成高质量的面向提案。第二阶段是面向 R-CNN 头,用于细化面向的兴趣区域(面向的 RoI)并识别它们。
    在没有技巧的情况下,带有 ResNet50 的面向 R-CNN 在两个常用的面向对象检测数据集上实现了最先进的检测精度,包括 DOTA (75.87% mAP) 和 HRSC2016 (96.50% mAP),同时速度为 15.1图像大小为 1024 的 FPS1024 在单个 RTX 2080Ti 上。我们希望我们的工作能够激发对定向检测器设计的重新思考,并作为定向目标检测的基准。
在这里插入图片描述

图1:生成面向对象提案的不同方案的比较。
  • (a)旋转RPN密集放置不同尺度、比例和角度的旋转锚。
  • (b)RoI Transformer+从水平RoI中学习面向的建议。它包括RPN、RoI校准和回归。
  • ©我们提出的面向对象的RPN。定向RPN的参数数约为RoI Transformer+的1/3000,旋转RPN的1/15。

三. 《Oriented R-CNN for Object Detection》文章详解

在这里插入图片描述

图2:oriented R-CNN的总体框架,它是基于FPN的两级检测器。

    第一阶段通过有向RPN生成有向提案,第二阶段是有向R-CNN头部对提案进行分类并细化其空间位置。为了更清楚地说明,我们没有显示面向RPN中的FPN以及分类分支。
在这里插入图片描述

图3:中点偏移表示的说明。
  • (a)中点偏移表示示意图。(b)中点偏移表示示例。

在这里插入图片描述

图4:盒子回归参数化的说明
  • 黑点是顶部和右侧的中点,橙色的点是有方向的边界框的顶点。
  • (a) Anchor (b)Ground truth box©预测的box。
    在这里插入图片描述
图5:旋转RoIAlign的过程示意图
  • 蓝框是有向RPN生成的平行四边形提案
  • 最左边的红框是其对应的用于投影和旋转RoIAlign的矩形提案。

四. 实验结果

在这里插入图片描述

图7:使用R-50-FPN骨干的oriented R-CNN在DOTA数据集上的检测结果示例
  • 当可视化这些结果时,置信阈值被设置为0.3。一种颜色代表一个对象类
    在这里插入图片描述
图8:HRSC2016数据集上使用R-50-FPN骨干的面向R-CNN检测结果示例
  • 显示分数高于0.3的定向包围框

http://www.niftyadmin.cn/n/819317.html

相关文章

Java学习网站推荐

1.当然是本站CSDN了 2.知乎,上面也有甚多大神 3.博客园 4.慕课网 5.蛙课网 6.网易云课堂 7.W3Cschool 8.菜鸟教程 9.GitHub 10.动力节点

CVPR2021 | 2D目标检测论文解读

CVPR2021 | 2D目标检测论文解读1. UP-DETR:——《UP-DETR: Unsupervised Pre-training for Object Detection with Transformers(Oral)》2. OWOD——《Towards Open World Object Detection(Oral)》3. YOLOF——《You Only Look One-level Feature》4. DeFCN——《End-to-End O…

java面向对象常考二十题(附答案)

1.super()与this()的区别? This():当前类的对象,super父类对象。 Super():在子类访问父类的成员和行为,必须受类继承规则的约束 而this他代表当前对象,当然所有的资源都可以访问. 在构造函数中,…

主动学习研究现状

主动学习研究现状一. 传统查询策略(Query Strategy)二. 在图像分类的应用三. 在目标检测的研究3.1.《Localization-Aware Active Learning for Object Detection 》(ACCV, 2018)3.2. 《Active Learning for Deep Object Detection via Probabilistic Mod…

MMSegmentation 训练测试全流程

MMSegmentation 训练测试全流程1.按照执行顺序的流程梳理Level 0: 运行 Shell 命令:Level 1: 在 tools/train.py 内:Level 2: 转进到 mmseg.apis 模块的 train_segmentor 函数内:Level 3: 转进到 mmcv/runner/iter_based_runner.py 内的 IterBasedRunner 类的 run 函数内部:Lev…

值得收藏的十种常用的CSS框架-蛙课网

CSS框架是预先准备好的软件框架,允许使用层叠样式表语言更容易,更符合标准的进行网页设计。大多数这些框架包含至少一个栅格设计(grid)。功能更强大的框架,还配备了更多的功能和附加的基于JavaScript的功能&#xff0c…

mmsegmentation训练自定义数据集(语义分割,Upernet,Swin-T)

mmsegmentation训练自定义数据集(语义分割,Upernet,Swin-T)1. 论文复现1.1. 原文结果1.2. 复现结果1.3. Test阶段速度:2. Mmsegmentation Trick2.1. Pipeline(加载数据、数据增强)2.2. 损失函数…

Java变量声明和赋值-蛙课网

你对Java变量声明和赋值熟悉吗?学过Java的人都知道在使用变量前要声明变量,然后赋值。因为变量声明是独立的代码孤岛,所以实际上只是一个语句,确切地说是一个简单的语句。下面的这些都是变量声明语句: int age 25; …