目标检测笔记(十一):如何结合特定区域进行目标检测(基于OpenCV的人脸检测实例)

news/2024/7/10 1:00:10 标签: 目标检测, 笔记, opencv

文章目录

  • 背景
  • 代码
  • 结果

背景

由于我们在做项目的时候可能会涉及到某个指定区域进行目标检测或者人脸识别等任务,所以这篇博客是为了探究如何在传统目标检测的基础上来结合特定区域进行检测,以OpenCV自带的包为例。

一般来说有两种方式实现区域指定:

  • 第一种:在网络处理之前,将特定区域划分出来,然后在送入到神经网络进行检测
  • 第二种:在网络处理之后,直接来划分区域的坐标对网络处理后目标进行判定,判定此目标是否在这个区域中,如果在则show,否则则略过

很明显通过第一种方式,网络可以减少很大的计算复杂度,因为不用将整张图片送入到网络中进行处理。

代码

这个代码是直接通过对特定区域结合OpenCV自带人脸检测器来进行人脸检测。若区域内,目标则被检测,超过区域则不被记录。

import cv2

face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')
cap = cv2.VideoCapture(0)
# 定义感兴趣区域的坐标和大小
roi_x = 200
roi_y = 100
roi_width = 300
roi_height = 300

while True:
    # 读取一帧图像
    ret, frame = cap.read()
    if not ret:
        print("无法读取摄像头图像")
        break

    # 获取感兴趣区域
    roi = frame[roi_y:roi_y+roi_height, roi_x:roi_x+roi_width]

    # 将感兴趣区域转换为灰度图像
    gray = cv2.cvtColor(roi, cv2.COLOR_BGR2GRAY)

    # 使用人脸检测器检测人脸区域
    faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))

    # 在原始图像上绘制感兴趣区域矩形
    cv2.rectangle(frame, (roi_x, roi_y), (roi_x+roi_width, roi_y+roi_height), (255, 0, 0), 2)

    # 在感兴趣区域上绘制人脸区域矩形
    for (x, y, w, h) in faces:
        cv2.rectangle(roi, (x, y), (x+w, y+h), (0, 255, 0), 2)

    # 在窗口中显示图像
    cv2.imshow("Camera", frame)

    if cv2.waitKey(1) == 27:
        break

cap.release()
cv2.destroyAllWindows()

这个代码在上面代码的基础上,加入了鼠标点击事件,用户可以通过自己来划分特定检测区域,划分之后将从整张图片的检测转换为特定区域的检测。

import cv2

def draw_roi(event, x, y, flags, param):
    global roi_x, roi_y, roi_width, roi_height, drawing
    if event == cv2.EVENT_LBUTTONDOWN:
        # 鼠标按下,开始绘制
        roi_x, roi_y = x, y

    elif event == cv2.EVENT_LBUTTONUP:
        # 鼠标释放,结束绘制
        roi_width, roi_height = x - roi_x, y - roi_y
        drawing = True


if __name__ == '__main__':
    # 创建一个全局变量来存储感兴趣区域的坐标和大小
    roi_x, roi_y, roi_width, roi_height = 0, 0, 0, 0
    drawing = False
    over = 0
    cap = cv2.VideoCapture(0)
    # 创建窗口并绑定鼠标事件
    cv2.namedWindow("Camera")
    cv2.setMouseCallback("Camera", draw_roi)
    # 加载人脸检测器
    face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')
    while True:
        ret, frame = cap.read()
        if not ret:
            print("无法读取摄像头图像")
            break

        # 如果触发了鼠标事件,则在感兴趣区域上运行人脸检测器
        roi = frame[roi_y:roi_y + roi_height, roi_x:roi_x + roi_width]

        # 在原始图像上绘制感兴趣区域矩形
        cv2.rectangle(frame, (roi_x, roi_y), (roi_x + roi_width, roi_y + roi_height), (255, 0, 0), 2)
        if drawing:
            gray = cv2.cvtColor(roi, cv2.COLOR_BGR2GRAY)
            faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))
            for (x, y, w, h) in faces:
                cv2.rectangle(roi, (x, y), (x + w, y + h), (0, 255, 0), 2)
        else:
            gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
            faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))
            for (x, y, w, h) in faces:
                cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 0), 2)

        cv2.imshow("Camera", frame)
        if cv2.waitKey(1) == 27:
            break

    cap.release()
    cv2.destroyAllWindows()

结果

在这里插入图片描述
在这里插入图片描述


http://www.niftyadmin.cn/n/4967891.html

相关文章

kafka复习:(17)seekToBeginning的用法

从分区的开始进行消费,因为kafka会定期清理历史数据,所以分区开始的位移不一定为0。seekToBeginning只是从目前保留的数据中最小的offset进行消费 package com.cisdi.dsp.modules.metaAnalysis.rest.kafka2023;import org.apache.kafka.clients.consume…

Java在项目中覆盖Jar包中的类

import cn.hutool.core.util.StrUtil;public class CoverJarTest {public static void main(String[] args) {System.out.println(StrUtil.toString("1"));} }输出1 我们将hutool的包名在我们的项目中创建一个,并且将对应类的源码复制一份过来&#xff0c…

docker能做什么?你真的清楚吗?

第一部分:开发与运行环境的一致性 Docker的首要优势在于其确保了开发与运行环境的一致性。这种一致性主要由以下几个方面的因素构成: 容器化技术:Docker使用了容器化技术,这种技术允许你在容器中打包应用以及应用依赖的所有文件、…

【Java从0到1学习】12 Java集合框架源码解读(6w字长文,快来收藏)

1. ArrayList源码剖析 1.1 ArrayList底层原理 利用空参创建的集合,在底层创建一个默认长度为0的数组名字为elementData,且还有一个底层变量size,用来记录元素的个数。添加第一个元素时,底层会创建一个新的长度为10的数组&#x…

windwos系统如何创建typecho个人博客并通过内网穿透实现无公网IP访问

文章目录 前言1. 环境安装2.安装Typecho3.安装cpolar内网穿透4. 固定公网地址5.配置Typecho 前言 Typecho是一款PHP语言编写的开源博客程序,它是一个轻量级的内容管理系统,专注于博客领域。支持多用户、多站点、多语言等功能,可以满足不同用…

【移动端开发】鸿蒙系统开发入门:代码示例与详解

一、引言 随着华为鸿蒙系统的日益成熟,越来越多的开发者开始关注这一新兴的操作平台。本文旨在为初学者提供一份详尽的鸿蒙系统开发入门指南,通过具体的代码示例,引导大家逐步掌握鸿蒙开发的基本概念和技术。 二、鸿蒙系统开发基础 鸿蒙系…

非流式HTTP和流式的Websocket区别

Websocket简介 Websocket 是一种在 Web 应用程序中实现全双工、持久性连接的通信协议。它是基于 HTTP 协议构建的,但与传统的 HTTP 请求-响应模型不同。下面详细解释 Websocket 是如何实现的: 1.HTTP 握手: 当客户端想要与服务器建立 WebSo…

抖音seo短视频矩阵系统源代码开发原型--开源

一、系统设计 1.需求分析 抖音SEO矩阵系统的主要功能是提高视频的曝光和排名,因此,其主要需求包括: 1)关键词研究:通过分析用户搜索行为,挖掘出热门关键词,以便制定针对性的SEO策略。 2&…