Transformer模型 | 用于目标检测的视觉Transformers训练策略

news/2024/7/10 0:10:55 标签: transformer, 目标检测, 深度学习

基于视觉的Transformer在预测准确的3D边界盒方面在自动驾驶感知模块中显示出巨大的应用,因为它具有强大的建模视觉特征之间远程依赖关系的能力。然而,最初为语言模型设计的变形金刚主要关注的是性能准确性,而不是推理时间预算。对于像自动驾驶这样的安全关键系统,车载计算机的实时推理是绝对必要的。这使得我们的目标检测算法在非常紧张的运行时间预算下。在本文中,我们评估了各种策略来优化基于视觉变换的物体检测方法的推理时间,并密切关注任何性能变化。我们为这些策略选择的度量是准确性-运行时联合优化。此外,对于实际的推理时间分析,我们使用TensorRT模块对float32和float16精度的策略进行了分析。这是业界在边缘设备上部署机器学习网络最常用的格式。我们表明,对于第3节中定义的问题陈述,我们的策略能够将推理时间提高63%,而性能下降仅为3%。这些策略降低了Vision transformer检测器的推理时间,甚至比传统的基于单图像的CNN检测器(如FCOS)还要短。我们建议从业者使用这些技术在预算受限的机器人平台上部署基于大型多视图网络的transformer

  1. 介绍

在过去的十年中,卷积神经网络(cnn)是由计算机视觉领域的模型架构更新驱动的。此外,已经提出了大量的技术来改进这些CNN模型的训练策略。最近,视觉变形器,首先由ViT提出,并通过基于dert的方法迭代重新制定,已经成为使用图像进行目标检测的更好的替代架构。然而,transformer目标检测社区的文献和排行榜更倾向于关注这些庞大模型的架构影响。当这些方法用于实际的机器人平台时,运行时精度的关节优化是最重要的,因为任何边缘设备都有有限的计算预算。此外,这些机器学习算法必须以高频率运行,因为自动驾驶汽车行驶速度相当快,需要以至少10hz(每秒10次)的速度更新其道路和动态代理的理解。在检测排行榜上,任何表


http://www.niftyadmin.cn/n/5117001.html

相关文章

【HarmonyOS】元服务卡片router实现跳转到指定页面并传动态参数

【关键字】 元服务卡片、router跳转不同页面、传递动态参数 【写在前面】 本篇文章主要介绍开发元服务卡片时,如何实现从卡片中点击事件跳转到指定的应用内页面,并传递参数接受参数功能。此处以JS UI开发服务卡片为例,JS卡片支持组件设置ac…

【FPGA】IIC协议通用主机接口的设计与实现详解

一、认识IIC IIC(I2C)协议是一种串行通信协议,用于连接微控制器和外围设备。IIC协议只需要两根信号线(时钟线SCL和数据线SDA)就能完成设备之间的通信;支持多主机和多从机通信,通过设备地址区分不…

MySQL的索引原理

文章目录 什么是索引?索引的工作原理创建和管理索引索引类型最佳实践总结 🎉欢迎来到数据结构学习专栏~MySQL的索引原理 ☆* o(≧▽≦)o *☆嗨~我是IT陈寒🍹✨博客主页:IT陈寒的博客🎈该系列文章专栏:数据结…

lwip多网卡自适应选择

当系统中有多个网卡时,lwip会选择第一个网卡作为默认网卡,ping、tftp、iperf都会选择第一个网卡来进行,没有办法使用第二个网卡(一些命令可以通过-i选项选择网卡,有些命令则没有提供),此时需要修…

内衣洗衣机和手洗哪个干净?内衣洗衣机热销第一名

这两年内衣洗衣机可以称得上较火的小电器,小小的身躯却有大大的能力,一键可以同时启动洗、漂、脱三种全自动为一体化功能,在多功能和性能的提升上,还可以解放我们双手的同时将衣物给清洗干净,让越来越多小伙伴选择一款…

假脸检测:Exploring Decision-based Black-box Attacks on Face Forgery Detection

论文作者:Zhaoyu Chen,Bo Li,Kaixun Jiang,Shuang Wu,Shouhong Ding,Wenqiang Zhang 作者单位:Fudan University;Yiwu Research Institute of Fudan University 论文链接:http://arxiv.org/abs/2310.12017v1 内容简介: 1&…

activiti7.0工作流,举个例子实现自定义任务监听和执行监听代码

public class MyListener implements TaskListener, ExecutionListener {// 实现任务监听TaskListenerOverridepublic void notify(DelegateTask delegateTask) {log.info("自定义任务监听器执行");String eventName delegateTask.getEventName();switch (eventName…

类模板Array带二个模板参数

#include <ostream> #include <iostream> using namespace std; //Array.h template <typename T, int size> class Array{ public: Array(); // 也算是默认构造函数&#xff0c;因为不需要传进去参数 bool push(T elem); void display(); priv…