【YOLOX】《YOLOX:Exceeding YOLO Series in 2021》

news/2024/7/10 3:18:38 标签: 目标检测, 计算机视觉, 深度学习, YOLOX

在这里插入图片描述

arXiv-2021


文章目录

  • 1 Background and Motivation
  • 2 Related Work
  • 3 Advantages / Contributions
  • 4 Method
  • 5 Experiments
    • 5.1 Datasets and Metrics
  • 6 Conclusion(own)


1 Background and Motivation

2 Related Work

3 Advantages / Contributions

4 Method

在这里插入图片描述
在这里插入图片描述

深入浅出Yolo系列之Yolox核心基础完整讲解

(1)输入端,mosaic 和 mixup,最后 15 个 epochs 会关闭

(2)预测头

解耦头会收敛更快,精度也会更高,但会增加运算的复杂度
在这里插入图片描述

anchor free,以 640 输入为例,总预测数量 ( 20 ∗ 20 + 40 ∗ 40 + 80 ∗ 80 ) ∗ ( 80 + 1 + 4 ) = 8400 ∗ 85 (20*20 + 40*40 + 80*80) * (80 + 1 +4) = 8400* 85 (2020+4040+8080)(80+1+4)=840085

anchor based,以 640 输入为例,总预测数量 3 ∗ ( 20 ∗ 20 + 40 ∗ 40 + 80 ∗ 80 ) ∗ ( 80 + 1 + 4 ) = 3 ∗ 8400 ∗ 85 3*(20*20 + 40*40 + 80*80) * (80 + 1 +4) = 3*8400* 85 3(2020+4040+8080)(80+1+4)=3840085

正负样本分配:初步筛选、SimOTA

初步筛选
a. 根据中心点来判断:寻找anchor_box中心点,落在groundtruth_boxes矩形范围的所有anchors
在这里插入图片描述

b.根据目标框来判断:以groundtruth中心点为基准,设置边长为5的正方形,挑选在正方形内的所有锚框。
在这里插入图片描述

这一步还是有候选框或者说 anchor 的概念的
在这里插入图片描述
因为不同层金字塔特征图上的空间位置映射为原图,还是有大小的

精细筛选—SimOTA
a.初筛正样本信息提取
b.Loss 函数计算
c.cost 成本计算
d.SimOTA 求解
在这里插入图片描述
假设初步筛选从 8400 筛选到只剩 1000, simOTA中,会选 cost 最小的前 k 个 作为正样本
在这里插入图片描述
可能出现共用情况,一个正样本分配了多个 GT

在这里插入图片描述
选 cost 最小的
在这里插入图片描述

5 Experiments

5.1 Datasets and Metrics

6 Conclusion(own)

YOLOX作者刘松涛博士:高性能目标检测的最新实践
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
解耦的好处在于:在检测的过程中分类需要的特征和回归所需要的特征不同,所以在 Decoupled Head 中进行解耦处理后学习的过程会变得更加简单。

在这里插入图片描述
在这里插入图片描述

  • 一文了解官方正式授命的YOLOv6
    在这里插入图片描述

http://www.niftyadmin.cn/n/4924632.html

相关文章

jpgraph生成雷达图

jpgraph生成雷达图 依赖 "amenadiel/jpgraph": "4"function createRadarGraph($values){// 创建基础雷达图$graph new RadarGraph (500,500);// 设置背景颜色和阴影$graph->SetColor([255,255,255]);//阴影$graph->SetShadow(false, 0, [255,255,…

【Docker晋升记】No.2 --- Docker工具安装使用、命令行选项及构建、共享和运行容器化应用程序

文章目录 前言🌟一、Docker工具安装🌟二、Docker命令行选项🌏2.1.docker run命令选项:🌏2.2.docker build命令选项:🌏2.3.docker images命令选项:🌏2.4.docker ps命令选项…

LeetCode——只出现一次的数字II(位运算方法/哈希方法)

题目地址 力扣 题目解析 位运算法 由题我们能知道该数组中只有一个数出现了一次,然而其他的数都出现了3次。 我们可以通过分析每一个二进制位的和来讨论这个题目的解法! 由于前边的条件,那么我们可以得出,某一个二进制位的和…

Android Studio实现简单ListView

效果图 MainActivity package com.example.listviewtest;import androidx.appcompat.app.AppCompatActivity;import android.os.Bundle; import android.widget.ListView;import com.example.listviewtest.adapter.PartAdapter; import com.example.listviewtest.bean.PartB…

【博学谷学习记录】超强总结,用心分享| 大数据课程-学习三十六周总结

9.3.SQL优化 9.3.1.map端join 默认情况下,Map阶段同一Key数据分发给一个reduce,当一个key数据过大时就倾斜了。 并不是所有的聚合操作都需要在Reduce端完成,很多聚合操作都可以先在Map端进行部分聚合,最后在Reduce端得出最终结果…

C语言和C++的区别在哪?如何自学C++?

C语言和C是两种不同的编程语言,它们在语法、特性和用途上有一些区别。以下是C语言和C的一些主要区别: 面向对象编程:C是一种支持面向对象编程的语言,它在C语言的基础上添加了类、对象、继承、多态等面向对象的特性。而C语言是一种…

【自然语言处理】大模型高效微调:PEFT 使用案例

文章目录 一、PEFT介绍二、PEFT 使用2.1 PeftConfig2.2 PeftModel2.3 保存和加载模型 三、PEFT支持任务3.1 Models support matrix3.1.1 Causal Language Modeling3.1.2 Conditional Generation3.1.3 Sequence Classification3.1.4 Token Classification3.1.5 Text-to-Image Ge…

图片怎么压缩大小?一分钟就能学会的压缩方法

压缩图片是最正常不过的需求了,很多时候我们都需要对图片大小进行压缩处理,比如上传证件照、减少存储空间等等,现在图片压缩的方法也很多,下面总结了几个简单且效果好的方法,供大家参考使用~ 一、嗨格式压缩大师 这是…