【深度学习目标检测】二十三、基于深度学习的行人检测计数系统-含数据集、GUI和源码(python,yolov8)

news/2024/7/10 0:53:00 标签: 深度学习, 目标检测, python

行人检测计数系统是一种重要的智能交通监控系统,它能够通过图像处理技术对行人进行实时检测、跟踪和计数,为城市交通规划、人流控制和安全管理提供重要数据支持。本系统基于先进的YOLOv8目标检测算法和PyQt5图形界面框架开发,具有高效、准确、易用等特点。

系统特点

  1. 基于YOLOv8的目标检测算法:YOLOv8是一种高效的目标检测算法,它能够在保证检测速度的同时,提高检测精度。本系统采用YOLOv8算法对行人进行检测,能够快速准确地识别出行人的位置,并进行计数。
  2. PyQt5图形界面框架:PyQt5是一种功能强大的图形界面开发框架,它支持跨平台开发,具有良好的可移植性。本系统采用PyQt5框架开发,界面简洁明了,易于操作。
  3. 支持多种检测方式:本系统支持对单张图片、视频文件和摄像头实时流进行检测。用户可以根据需要选择不同的检测方式,满足不同的应用场景。
  4. GPU加速功能:本系统支持GPU加速功能,可以将预测计算任务分配到GPU上进行处理,提高系统的实时检测性能。相比在CPU上进行处理,GPU加速可以大幅度降低延时,提升用户体验。

本文介绍了基于深度学习yolov8的行人检测计数系统,包括训练过程和数据准备过程,同时提供了推理的代码和GUI。对准备计算机视觉相关的毕业设计的同学有着一定的帮助。

模型在线体验:https://o554w00336.goho.co/

检测结果如下图:

一、安装YoloV8

yolov8官方文档:主页 - Ultralytics YOLOv8 文档

安装部分参考:官方安装教程

1、安装pytorch

根据本机是否有GPU,安装适合自己的pytorch,如果需要训练自己的模型,建议使用GPU版本。

①GPU版本的pytorch安装

对于GPU用户,安装GPU版本的pytorch,首先在cmd命令行输入nvidia-smi,查看本机的cuda版本,如下图,我的cuda版本是12.4(如果版本过低,建议升级nvidia驱动):

打开pytorch官网,选择合适的版本安装pytorch,如下图,建议使用conda安装防止cuda版本问题出现报错:

②CPU版本pytorch安装

打开pytorch官网,选择CPU版本安装pytorch,如下图:

2、安装yolov8

在命令行使用如下命令安装:

pip install ultralytics

二、数据集准备

本文数据集来自http://www.cbsr.ia.ac.cn/users/sfzhang/WiderPerson/

该数据集包含8000个训练数据,1000个验证数据,4382个测试数据,数据如下图:

为了使用yolov8算法进行训练,需要将该数据转换为yolov8格式,本文提供转换好的数据集下载连接:widerperson(密集行人检测)yolov8格式数据集,该数据集8000个训练数据,1000个验证数据,4382个测试数据

三、模型配置及训练

1、数据集配置文件

创建数据集配置文件rsna_pneumonia.yaml,内容如下(将path路径替换为自己的数据集路径):

# Ultralytics YOLO 🚀, AGPL-3.0 license
# COCO 2017 dataset http://cocodataset.org by Microsoft
# Example usage: yolo train data=coco.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco  ← downloads here (20.1 GB)
 
 
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: D:\DeepLearning\datasets\csdn\widerperson\widerperson_yolov8  # 替换为自己的数据集路径
train: images/train 
val: images/val 
test: images/val  
 
# Classes
names:
  # 0: normal
  0: pedestrains

2、训练模型

使用如下命令训练模型,数据配置文件路径更改为自己的路径,model根据自己的需要使用yolov8n/s/l/x版本,其他参数根据自己的需要进行设置:

yolo detect train project=widerperson name=train exist_ok data=widerperson/widerperson.yaml model=yolov8n.yaml epochs=100 imgsz=480 

3、验证模型

使用如下命令验证模型,相关路径根据需要修改:

yolo detect val project=widerperson name=val imgsz=480 model=widerperson/train/weights/best.pt data=widerperson/widerperson.yaml

精度如下:

# Ultralytics YOLOv8.1.20 🚀 Python-3.9.18 torch-2.2.0 CUDA:0 (NVIDIA GeForce RTX 3060, 12288MiB)
# YOLOv8n summary (fused): 168 layers, 3005843 parameters, 0 gradients, 8.1 GFLOPs
# val: Scanning D:\DeepLearning\datasets\csdn\widerperson\widerperson_yolov8\labels\val.cache... 1000 images, 0 backgrounds, 0 corrupt: 100%|██████████| 1000/1000 [00:00<?, ?it/s]
#                  Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 63/63 [00:08<00:00,  7.15it/s]
#                    all       1000      27353      0.813      0.606      0.722      0.452
# Speed: 0.1ms preprocess, 2.6ms inference, 0.0ms loss, 1.3ms postprocess per image
# Results saved to widerperson\val
# 💡 Learn more at https://docs.ultralytics.com/modes/val

四、推理

训练好了模型,可以使用如下代码实现推理,权重路径修改为自己的路径:

from PIL import Image
from ultralytics import YOLO
 
# 加载预训练的YOLOv8n模型
model = YOLO('best.pt')
 
image_path = 'test.jpg'
results = model(image_path)  # 结果列表
 
# 展示结果
for r in results:
    im_array = r.plot()  # 绘制包含预测结果的BGR numpy数组
    im = Image.fromarray(im_array[..., ::-1])  # RGB PIL图像
    im.show()  # 显示图像
    im.save('results.jpg')  # 保存图像

五、界面开发

使用pyqt5开发gui界面,支持图片、视频、摄像头输入,支持导出到指定路径,其GUI如下图(完整GUI代码可在下方链接下载):

代码下载连接:基于yolov8的行人检测系统,包含训练好的权重和推理代码,GUI界面,支持图片、视频、摄像头输入,支持检测结果导出


http://www.niftyadmin.cn/n/5427345.html

相关文章

评估 Amazon DocumentDB 与 MongoDB 的兼容性

Amazon声称从MongoDB迁移到DocumentDB “非常简单&#xff0c;只需要将数据库端点切换为新的 Amazon DocumentDB 集群”。但确实如此吗&#xff1f; 我们通过对 DocumentDB 的 API 仿真运行 6 个 MongoDB 测试套件&#xff08;总计 1,481 次测试&#xff09;来定期评估 Docume…

ARM 汇编指令:(三)运算处理指令

目录 一.add指令 二.sub指令 三.MUL指令 一.add指令 add用于执行实现两个寄存器或寄存机或寄存器与立即数的相加操作。它可以用于整数、浮点数等各种数据类型的加法运算。 ADD{cond}{S} Rd,操作数,操作数 1.不带进位加法指令add add r1, r2, #4 //r1 r2 4 add r1, r2 …

从 0 开始带你成为JVM实战高手

从0开始成为JVM实战高手 一、开篇 在Java的世界里&#xff0c;JVM&#xff08;Java Virtual Machine&#xff0c;Java虚拟机&#xff09;是每一位开发者都无法绕过的核心组件。它负责Java字节码的加载、链接、解释、执行以及垃圾回收等重要任务。想要成为一名JVM实战高手&…

css隐藏元素的方式有哪些?

使用CSS的display属性&#xff1a;将元素的display属性设置为"none"可以完全隐藏元素&#xff0c;并且不保留其空间。 .element {display: none; }使用CSS的visibility属性&#xff1a;将元素的visibility属性设置为"hidden"可以隐藏元素&#xff0c;但仍…

滴滴 Flink 指标系统的架构设计与实践

毫不夸张地说&#xff0c;Flink 指标是洞察 Flink 任务健康状况的关键工具&#xff0c;它们如同 Flink 任务的眼睛一般至关重要。简而言之&#xff0c;这些指标可以被理解为滴滴数据开发平台实时运维系统的数据图谱。在实时计算领域&#xff0c;Flink 指标扮演着举足轻重的角色…

【数学建模】熵权法 Python代码

熵权法是一种客观的赋权方法&#xff0c;它可以靠数据本身得出权重。 依据的原理&#xff1a;指标的变异程度越小&#xff0c;所反映的信息量也越少&#xff0c;其对应的权值也应该越低。 import numpy as np#自定义对数函数mylog&#xff0c;用于处理输入数组中的0元素 def m…

wrap:包装

1、wrap(对象)调用对象的函数&#xff0c;来产生新的值。 const getName () > {return Jane Lane }cy.wrap({ name: getName }).invoke(name).should(eq, Jane Lane) // truewrap(对象)&#xff0c;断言对象的属性、属性包含的值 it(cy.wrap() - wrap an object, () >…

VR数字展厅在企业中应用的优势有哪些?

随着VR全景技术的成熟&#xff0c;VR数字展厅逐渐成为了企业展示形象和产品的重要手段之一。VR企业数字展厅是一种通过VR技术、3D建模技术展示企业形象和产品的创新方式&#xff0c;将企业线下的展厅搬到线上&#xff0c;为企业品牌形象带来了很多优势。 VR数字展厅在企业中应用…