目标检测术语篇

news/2024/7/10 0:25:33 标签: 目标检测, 人工智能, 计算机视觉

目标检测入门——术语篇 | Hotel's Blog (hotelll.github.io)//借鉴以下图表

术语解释
IoU图和框的 交集/并集,判断检测是否正确的阈值,通常为 0.5。
P每张图像中被检测出的正确目标占总目标数的多少。
AP对于一个类别的平均精度,图像个数/总精度和。
MAP所有类别的平均精度和/总类别数。
AP50...AP50代表 IoU 取 0.5,AP60代表 IoU 值取 0.6。数值越高越难。
ROIRegion of Interest,有很大可能性包含检测目标的区域。
Anchor预先设定在图像上的密集方框,用于后续检测标记。
Region Proposals建议区域,经过 Region Proposal Network(RPN) 得到一个 region 的 p≥0.5,则这个 region 中可能具有目标,这些选出来的区域被称为 ROI(Region of Interests)。RPN 同时会在 feature map 上框定 ROI 大致位置,输出 Bounding-box。
one-stage一步检测器,指从图片到检测结果一步到位。(e.g. YOLO, SSD)
two-stage两步检测器,指分两步走,先从图片提取 ROI,再进行检测。(e.g. RCNN, FPN, etc.)
skeleton骨骼点,常见于行为检测数据集,标记人体几个重要位置的数据。
Re-ID行人重识别,利用计算机视觉技术判断图像或者视频序列中是否存在特定人的技术。
backbone图像特征提取器,往往是目标检测的第一步,常用 ResNet
head分类+定位器
neck插在 backbone 和 detection head 之间的模块,使网络更好地融合/提取 backbone 给出的特征,提高网络性能,例如:FPN,NAS-FPN,PAN,ASFF,RFB,SPP。这部分是科研的主攻点。

目标检测网络中的neck、head等是什么意思?

目标检测网络中,neck是指连接backbone和head的中间层,它的主要作用是将backbone提取的特征进行进一步的处理,以便与head中的分类器和回归器相结合,生成最终的检测结果。而head则是输出层,它包含一个分类器和一个回归器,用于预测目标的类别和位置。因此,neck和head都是目标检测网络中非常重要的组成部分。

请详细讲一下head

目标检测网络中,head是输出层,主要负责预测目标的类别和位置它通常包含一个分类器和一个回归器,用于生成最终的检测结果。

分类器用于判断目标属于哪个类别,通常是一个全连接层(有多少类就有多少结点),其输入是neck提取的特征,输出是每个类别的得分。在训练过程中,分类器的参数会被不断优化,以提高模型的分类准确率。

回归器则用于预测目标的位置,通常是一个包含4个输出节点的全连接层,对应目标的左上角和右下角的坐标。在训练过程中,回归器的参数也会被不断优化,以提高模型的位置精度。

在生成最终的检测结果时,通常会使用非极大值抑制(NMS)算法对输出结果进行筛选,以去除重叠的检测框,并选择置信度最高的检测框作为最终的结果。

需要注意的是,不同的目标检测网络可能会有不同的输出层结构,比如一些网络可能会在head中使用多个分类器和回归器,以提高检测精度和速度。

RPN与Head的关系?

在Faster R-CNN中,Region Proposal Network(RPN)和Head是两个独立的模块,但它们是紧密相连的,一起组成了完整的目标检测模型。

RPN是用于生成候选框的模块,它接受来自backbone的特征图作为输入,通过滑动窗口的方式在特征图上生成一组候选框,并对每个候选框的前景/背景进行分类和边界框回归。具体来说,RPN通过卷积操作提取特征,然后使用锚点框对特征图上的每个位置进行覆盖,得到候选框。而分类器和回归器则是用来预测每个候选框的前景/背景和边界框偏移量的。

Head则是用于检测和分类候选框的模块,它接受来自RPN的候选框作为输入,并在每个候选框上进行分类和边界框回归。Head的分类器和回归器通常是全连接层,用于对每个候选框进行分类和位置预测。最终,通过应用非极大值抑制(NMS)算法来去除重叠的检测框并选择最终的检测结果。

因此,RPN和Head的关系是,RPN用于生成候选框,Head用于检测和分类候选框,二者协同工作构成了Faster R-CNN的完整目标检测流程。

Reference

ChatGPT

五、目标检测基础和概念与术语 - 知乎 (zhihu.com)

 


http://www.niftyadmin.cn/n/466200.html

相关文章

常见分布式事务

一、2PC 将事务的提交过程分为 资源准备 和 资源提交 两个阶段,准备阶段所有事务参与者都预留资源的成功与否,决定了第二阶段提交或回滚。 2PC 第一阶段:准备阶段 1.协调者向所有参与者发送事务内容,询问是否可以提交事务&#…

Linux常用命令大全(极简速查版本)(包含操作nginx、mysql)

rm -rf /* 跑路 常见命令: ssh 连接远程服务器 pwd 所在目录位置 ifconfig 网络设备信息 free 服务器内存 df -lh 磁盘空间 mdkir 新建目录 cd 切换目录 git github拉取项目代码 ls 查看当前目录下的文件 ls -l 目录地址 看是否有对应目录 du 查看当前占用空间 cat…

5.Mysql高级查询语句 三

文章目录 存储过程创建存储过程查看存储过程存储过程参数删除存储过程存储过程控制语句条件语句 if-then-else ...... end if循环语句 while ..... end while 存储过程 存储过程是一组为了完成特定功能的SQL语句集合 存储过程在使用过程中是将常用或者复杂的工作预先使用SQL语…

访问学者申请者应该如何准备面试?

申请国外访问学者职位的学者,通常需要经过外方导师skype(或电话)面试的考察,那么访问学者申请者应该如何准备面试? 在访学申请过程中,可能会经过两次面试,一个是申请签证的vo面签,一…

MacOS 中 ARM64 汇编 ldr =address 伪指令导致运行时崩溃的原因及解决

0. 概览 我们知道在 MacOS 的 as 汇编器中有一条 ldr 伪指令,使用它我们可以非常方便的将立即数加载到寄存器中。 不过,当 ldr 的源操作数是一个标签(Label)时,就会导致在运行时发生崩溃: 如上图所示&…

【FPGA入门】第七篇、FPGA驱动VGA实现动态图像移动

目录 第一部分、实现效果 第二部分、动态VGA显示的原理 1、将动态显示的区域提前进行赋值 2、图像块的移动是每张图片叠加后的效果 3、如何实现图像块位置的改变 第三部分、系统结构和驱动波形 1、系统的Top-down结构 2、图像块移动的驱动波形 第四部分、代码 1、同步…

【Python】异常处理 ⑤ ( 异常传递 | 异常处理顺序 | 代码示例 )

文章目录 一、Python 异常传递1、异常传递性2、代码示例 - 异常传递性3、代码示例 - 在指定位置处理异常 一、Python 异常传递 1、异常传递性 在 Python 中 , 异常是具有传递性的 , 该特性是 Python 中的一个重要特性 , 它使得代码更加健壮和可靠 ; 异常传递 指的是 在代码中捕…

【数据结构与算法C++实现】1、异或的用法

原视频为左程云的B站教学 文章目录 1 异或换值2 求出数组中唯一一个出现奇数次的数3 求出数组中的两个出现奇数次的数 异或: 相同为0,不同为1。 更好的记忆方式: 不进位相加 10010 ^ 01100--------11110性质 0 ^ N N,N ^ N 0…