yolov8实战第一天——yolov8部署并训练自己的数据集(保姆式教程)

news/2024/7/23 23:24:25 标签: yolov8, 部署

​​​​​​yolov8实战第二天——yolov8训练结果分析(保姆式解读)-CSDN博客 

YOLOv8是一种基于深度神经网络的目标检测算法,它是YOLO(You Only Look Once)系列目标检测算法的最新版本。YOLOv8的主要改进包括:

  1. 更高的检测精度:通过引入更深的卷积神经网络和更多的特征层,YOLOv8可以在保持实时性的同时提高检测精度。

  2. 更快的检测速度:通过对模型进行优化,YOLOv8可以在不降低检测精度的情况下提高检测速度。

  3. 支持更多的检测任务:除了传统的物体检测任务之外,YOLOv8还支持人脸检测、车辆检测等更多的检测任务。

  4. 更易于训练和部署:YOLOv8采用了更加简单的网络结构和训练策略,使得它更易于训练和部署

YOLOv8是一个非常强大的目标检测算法,它在准确性、速度和易用性方面都具有很大的优势,因此在工业界和学术界都受到了广泛的关注和应用。

一、yolov8部署

说明:请严格安装部署步骤。

第一步、显卡驱动查看 nvidia-smi 


第二步、yolo8代码下载

https://github.com/ultralytics/ultralytics 


第三步、cuda及cudnn安装

https://developer.nvidia.com/cuda-toolkit-archive 

https://developer.nvidia.com/rdp/cudnn-archive 


第四步、安装anaconda

https://www.anaconda.com/download

环境变量设置(安装在哪里就找那个路径):


第五步、创建python环境

conda create -n yolo python==3.11 

conda环境操作指南:

查看现有环境 conda env list  

激活失败 conda init cmd.exe

删除环境 conda env remove -n yolo 


第六步、激活环境

一定要选择命令提示符。

activate yolo

以后每次使用都要激活该环境。


第七步、安装pytorch

https://pytorch.org/

我是cuda12.0,所以安装cuda11.8版本。 

conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia


第八步、安装库

pip install ultralytics -i https://pypi.tuna.tsinghua.edu.cn/simple


第九步、推理检测

yolo predict model=yolov8n.pt source=bus.jpg

图片名自己设置,自动下载模型yolov8n.pt,结果在runs文件夹中。

第十步、训练

yolo train data=coco128.yaml model=yolov8n.pt epochs=10 lr0=0.01

自动训练下载数据集datasets,报错,设置安装anaconda所在盘的虚拟内存。

二、yolov8训练自己的数据集

第一步、数据准备

yolov8中建立datasets文件夹,然后建立数据集文件夹mydata。

mydata中是imges图片文件和label标注后的Annotations xml文件夹和imageSets。 

其中使用makeTxt.py,给数据分类trian val test。

import os
import random
 
trainval_percent = 0.1
train_percent = 0.9
xmlfilepath = './Annotations'
txtsavepath = './ImageSets'
total_xml = os.listdir(xmlfilepath)
 
num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)
 
ftrainval = open('./ImageSets/trainval.txt', 'w')
ftest = open('./ImageSets/test.txt', 'w')
ftrain = open('./ImageSets/train.txt', 'w')
fval = open('./ImageSets/val.txt', 'w')
 
for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftest.write(name)
        else:
            fval.write(name)
    else:
        ftrain.write(name)
 
ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

运行后ImageSets文件夹生成四个txt。 

再使用voc_label.py,将数据转换成label格式。修改自己的类,逗号隔开,我训练的就一个“老鼠”类。

import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join

sets=[('train'), ('test'),('val')]

classes = ["mouse"]


def convert(size, box):
    dw = 1./(size[0])
    dh = 1./(size[1])
    x = (box[0] + box[1])/2.0 - 1
    y = (box[2] + box[3])/2.0 - 1
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x*dw
    w = w*dw
    y = y*dh
    h = h*dh
    return (x,y,w,h)

def convert_annotation(image_id):
    in_file = open('Annotations/%s.xml'%(image_id))
    out_file = open('labels/%s.txt'%( image_id), 'w')
    tree=ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)

    for obj in root.iter('object'):
        # difficult = obj.find('difficult').text
        cls = obj.find('name').text
        # if cls not in classes or int(difficult)==1:

        if cls not in classes:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))
        bb = convert((w,h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

wd = getcwd()

for image_set in sets:
    if not os.path.exists('labels/'):
        os.makedirs('labels/')
    image_ids = open('ImageSets/%s.txt'%(image_set)).read().strip().split()
    list_file = open('%s.txt'%(image_set), 'w')
    for image_id in image_ids:
        list_file.write('%s/images/%s.jpg\n'%(wd,image_id))
        convert_annotation(image_id)
    list_file.close()

#os.system("cat 2008_train.txt > train.txt")
#os.system("cat 2008_train.txt 2008_val.txt > train.txt")
#os.system("cat 2008_train.txt 2008_val.txt 2008_test.txt> train.txt")

#os.system("cat 2014_train.txt 2014_val.txt 2012_train.txt 2012_val.txt > train.txt")
#os.system("cat 2007_train.txt 2007_val.txt 2007_test.txt 2012_train.txt 2012_val.txt > train.all.txt")

运行后生成labels文件夹和三个txt。

至此数据准备工作完成,开始训练。 

第二步、训练

建立一个yaml文件

shu.yaml

train: datasets/mydata/train.txt
val: datasets/mydata/val.txt


# Classes
names:
  0: mouse

训练指令:

yolo train data=shu.yaml model=yolov8n.pt epochs=100 lr0=0.01 

至此训练完成。 在runs中生成训练结果和训练模型。

训练结果分析:yolov8实战第二天——yolov8训练结果分析(保姆式解读)-CSDN博客

第三步、测试 

使用训练后的模型进行测试。

测试指令:

yolo predict model=runs/detect/train12/weights/best.pt source=datasets/mydata/images/mouse-4-6-0004.jpg


http://www.niftyadmin.cn/n/5267824.html

相关文章

对部门进行排序

题目描述 : 给定一组部门信息存在departsMents , departsMents[i] 表示 cityName 部门所在城市,departName 部门名称, personNum部门人数 先从每个城市选取人数最多的5个部门作为分析对象,当人数相等时优先选取depart…

数据可视化---柱状图

import matplotlib.pyplot as plt import numpy as npdef plot_bar_chart(data, labels, colorsNone, title"Bar Chart", xlabel"X-Axis", ylabel"Y-Axis"):"""绘制柱状图,并在柱子上显示数量和比例。:param data: 包…

KL散度、CrossEntropy详解

文章目录 0. 概述1. 信息量1.1 定义1.2 性质1.3 例子2. 熵 Entropy2.1 定义2.2 公式2.3 例子3. 交叉熵 Cross Entropy3.1 定义3.2 公式3.3 例子4. KL 散度(相对熵)4.1 公式

【JavaScript 】JavaScript 数组对象操作数组的方法(很全带示例)

JavaScript 数组对象操作数组的方法 1. push() - 向数组的末尾添加一个或多个元素,并返回新的长度。2. pop() - 删除并返回数组的最后一个元素。3. shift() - 删除并返回数组的第一个元素。4. unshift() - 向数组的开头添加一个或多个元素,并返回新的长度…

ETLCloud的应用策略——实时数据处理是关键

一、ETLCloud是什么? ETLCloud又称数据集成(DataOps),是RestCloud旗下的一款数据仓库管理工具,通过自动化数据转换和集成来实现企业内部和外部数据的无缝对接,从而帮助企业快速获取准确的数据信息&#xff…

显示器件是什么

显示器件 电子元器件百科 文章目录 显示器件前言一、显示器件是什么二、显示器件的类别三、显示器件的应用实例四、显示器件的作用原理总结前言 显示器件根据不同的技术原理和应用领域,具有不同的特点和优势,可适用于电子产品、电视、计算机显示器、手持设备、汽车仪表盘等…

C语言写的 mini版的 http 服务器 , 很详细

文章目录 效果展示整体架构流程技术细节完整代码 效果展示 例如:htpp://192.168.23.140/home.html -> 正确的请求格式 home.html 这个资源是放在我们服务器里面的 , 并不是随便访问的资源,当然我们可以放很多的资源进去. 整体架构流程 整个实现的流…

TrustGeo代码理解(一)main.py

代码链接:https://github.com/ICDM-UESTC/TrustGeo 一、导入各种模块和数据库 # -*- coding: utf-8 -*- import torch.nnfrom lib.utils import * import argparse, os import numpy as np import random from lib.model import * import copy from thop import profile imp…