论文提要“Selective Search for Object Recognition”

news/2024/7/10 1:31:30 标签: 目标检测

这篇2012年的IJCV使用分割和穷举搜索的方法产生目标proposal,最近出现的R-CNN就是在这些proposal上学习特征进行目标识别的,目标proposal是相对于滑动窗产生的候选框来说的,proposal的数量要少很多。

区域可以归并到一起的原因有很多,如下图所示,(b)颜色,(c)纹理,(d)包含问题,车辆包含车轮等。
这里写图片描述

论文提出了一种数据驱动的SS,结合穷举搜索和多元化采样方法捕获所有的可能区域,文章回答了几个问题:1)自适应分割的多元化策略有哪些,2)产生高质量loc的效率,3)使用SS结合好的分类器和模型描述方法来做目标识别;

算法描述:
SS算法的设计基于以下考虑:1)捕获所有尺度,2)多样化归并方法,3)速度快。首先使用论文“Efficient Graph-Based Image Segmentation”中的方法生成一些起始的小区域,之后使用贪心算法将区域归并到一起:先计算所有临近区域间的相似度,将最相似的两个区域归并,然后重新计算临近区域间的相似度,归并相似区域直至整幅图像成为一个区域,算法具体描述如下:
这里写图片描述

多元化策略:使用不同的颜色空间和不同的相似度计算方法
A.互补的颜色空间
在一系列颜色空间中实现多级归并算法,包括RGB,灰度图,Lab,rgI,HSV,归一化RGB,etc.
B.互补的相似度度量
1)颜色相似度,颜色直方图交叉函数这里写图片描述
2)纹理相似度,使用类SIFT度量,对每个颜色通道在8个方向上进行高斯微分,每个通道的每个方向提取出一个bin是10的直方图,获得一个240维大小的直方图,最后使用 L1 范数进行归一化,同样适用交叉函数进行相似度度量
3)尺度相似度,计算两个区域共同占有图像面积的比例,小区域优先合并,同时放置某个区域将其他区域全部吞并。
4)填充相似度,主要用来填充缝隙,如果 ri 包含在 rj 内,显然需要将它们合并,定义 BBij 为包围 ri rj 的框,填充相似度计算 BBij 中没被 ri rj 覆盖的区域占整幅图像的比例:
这里写图片描述

最终的相似度度量是以上四种相似度度量的组合:
这里写图片描述

Combining Locations
对假设的目标进行排序,对于给定的归并策略j,使用 rji 表示层i对应的区域,i=1时区域为整幅图像,令其位置值 vji=RND×i ,最终的排名是使用 vji 对区域进行排序. (没懂啥意思)

目标分类
分类使用的特征是BOW,采用颜色-SIFT和精细空间分割,词袋适合可变物体的识别,HOG适合刚体的识别,分类器使用的SVM。训练框架如下图所示:
这里写图片描述
正样本为物体的ground truth,负样本为SS产生的与正样本交叠20%~50%的proposal,同时剪除了重叠面积大于70%的负样本,这些负样本是hard样本,在分类中能够成为支持向量。


http://www.niftyadmin.cn/n/491782.html

相关文章

论文提要“Visual Categorization with Bags of Keypoints”

‘Selective Search for Object Recognition” 文章中特征描述使用了BOW,找到这篇文章看了一下,主要是提取BOK来做广义的目标归类,分类器使用的是朴素贝叶斯和SVM,实验对七类广义目标进行归类,目标姿态不一&#xff0c…

GeoDa空间计量(三)——绘制地图

GeoDa空间计量(三)——绘制地图无主题地图分位数地图百分位数地图箱形图地图标准差地图自然断点分类法地图等间距分类法地图条件地图示意地图本文使用数据与 GeoDa空间计量(二)相同,具体方式看GeoDa空间计量&#xff0…

通通透透看无服务器计算:由来、场景和问题

一、 无服务器(Serverless)计算是什么云计算涌现出很多改变传统IT架构和运维方式的新技术,比如虚拟机、容器、微服务,无论这些技术应用在哪些场景,降低成本、提升效率是云服务永恒的主题。过去十年来,我们已…

Spatial Pyramid Matching

论文提出了一种场景归类的方法,主要通过将图像划分为精细子区域并在子区域中计算局部特征直方图实现,Spatial Pyramid是无序BOF特征的一种发展,增加了空间位置信息。 Pyramid Matching Kernels 假设X和Y是d维特征空间中的两个向量集&#x…

GeoDa空间计量(五)——空间计量模型

GeoDa空间计量(五)——空间计量模型OSL模型空间滞后模型空间误差模型自变量空间滞后模型空间杜宾模型空间杜宾误差模型本文以1984年哥伦布市的俄亥俄州的49个街区的数据为基础,构建OLS模型,空间滞后模型,空间误差模型&…

修改默认Shell环境

公司弄了台深度学习的服务器,前段时间给另一部门使用后,他们默认使用了 zsh 作为 默认 shell 环境,其中使用的 python 等环境基本是比较老版本,以及没有安装 tf 环境,果断的准备还原为我所习惯的 bash 环境。 先介绍下…

GeoDa空间计量(四)——绘制统计图

GeoDa空间计量(四)——绘制统计图直方图箱形图散点图气泡图3D散点图平行坐标图条件图直方图 (一)打开含有分析变量的shp文件,本文使用的是‘China.shp’。 (二)绘制直方图 点击‘Explore’下的…

论文提要“You Only Look Once: Unified, Real-Time Object Detection”

项目主页:http://pjreddie.com/darknet/yolo/ 这篇文章着重在检测的速度提升,区别于之前的方法是用分类器来做检测,文章对bbox和对应的类概率进行回归,检测速度可以达到45f/s,mAP与原始的R-CNN差不多。 出现原因&…