Shape-IoU:考虑边框形状与尺度的度量

news/2024/7/10 1:22:10 标签: 人工智能, 深度学习, 目标检测

文章目录

  • 摘要
  • 1、简介
  • 2、 相关工作
  • 3、方法
  • 4、实验
  • 5、 结论

摘要

https://arxiv.org/pdf/2312.17663.pdf
作为检测器定位分支的重要组成部分,边界框回归损失在目标检测任务中发挥着重要作用。现有的边界框回归方法通常考虑真实框(GT box)与预测框之间的几何关系,并使用边界框的相对位置和形状来计算损失,而忽略了边界框的固有属性(如形状和尺度)对边界框回归的影响。为了弥补现有研究的不足,本文提出了一种专注于边界框本身形状和尺度的边界框回归方法。首先,我们分析了边界框的回归特性,发现边界框本身的形状和尺度因素会对回归结果产生影响。基于上述结论,我们提出了Shape IoU方法,该方法可以通过关注边界框本身的形状和尺度来计算损失,从而使边界框回归更加准确。最后,我们通过大量对比实验验证了我们的方法,实验结果表明,我们的方法可以有效提高检测性能,并优于现有方法,在不同的检测任务中都取得了最先进的性能。代码可在https://github.com/malagoutou/Shape-IoU获取。

索引术语:目标检测、损失函数和边界框回归


http://www.niftyadmin.cn/n/5309265.html

相关文章

GEE:随机数

作者:CSDN _养乐多_ 本文将介绍在 Google Earth Engine(GEE)上生成随机数的 API,可以指定随机数的生成范围、类型(整型、浮点型)、分布方式(均匀分布、正态分布)。 文章目录 一、随…

【Airsim】各种设置详解

警告: settings.json 中仅添加不需要默认值的设置,其他保留默认 ref https://github.com/microsoft/AirSim/blob/main/docs/settings.md设置 设置存储位置 AirSim 按以下顺序搜索设置定义。将使用第一个匹配项: 查看-settings命令行参数指…

深入理解并解析Flutter Widget

文章目录 完整代码程序入口构建 Widget 结构定义 widget 状态定义 widget UI获取上下文关于build()build() 常用使用 完整代码 import package:english_words/english_words.dart; import package:flutter/material.dart; import package:provider/provider.dart;void main() …

Linux编写SH脚本启动单个jar应用

目录 一、启动脚本第一步:创建一个脚本文件第二步:把下面代码复制到脚本中第三步:给脚本授权 二、停止脚本第一步:创建一个脚本文件第二步:把下面代码复制到脚本中第三步:给脚本授权 结尾 一、启动脚本 第一…

el-form点击提交后把验证失败的数据传给了后端

问题&#xff1a;版本号需要根据后端返回的结果查看是否可用&#xff0c;在这里1.0.0是不可用的&#xff0c;如果点击其他地方则会报红&#xff0c;可是直接点击提交&#xff0c;则会把1.0.0这个错误的数据也提交给后端。 解决方案&#xff1a; html代码&#xff1a; <el…

【LMM 012】TinyGPT-V:24G显存训练,8G显存推理的高效多模态大模型

论文标题&#xff1a;TinyGPT-V: Efficient Multimodal Large Language Model via Small Backbones 论文作者&#xff1a;Zhengqing Yuan, Zhaoxu Li, Lichao Sun 作者单位&#xff1a;Anhui Polytechnic University, Nanyang Technological University, Lehigh University 论文…

C++ 数组详解,很全,很详细

数组 (C) 数组是相同类型的对象序列&#xff0c;它们占据一块连续的内存区。 传统的 C 样式数组是许多 bug 的根源&#xff0c;但至今仍很常用&#xff0c;尤其是在较旧的代码库中。 在新式 C 中&#xff0c;我们强烈建议使用 std::vector 或 std::array&#xff0c;而不是本部…

LeetCode简单题记录

1、两数之和&#xff0c;给定数组nums&#xff0c;求和为target的两个数组元素的下标 我用了两个for循环&#xff0c;官方解为 哈希表&#xff0c;知识盲区 class Solution { public:vector<int> twoSum(vector<int>& nums, int target) {unordered_map<i…