项目实战 | YOLOv5 + Tesseract-OCR 实现车牌号文本识别

news/2024/7/10 0:38:38 标签: 人工智能, 目标检测, 深度学习, opencv

项目实战 | YOLOv5 + Tesseract-OCR 实现车牌号文本识别


最近看到了各种各样的车牌识别,觉得挺有意思,自己也简单搞一个玩玩😼。
传统的图像处理算法我也不太会,就直接用深度学习的方法实现吧。


文章目录

  • 项目实战 | YOLOv5 + Tesseract-OCR 实现车牌号文本识别
    • 1. 预期效果
    • 2. 整体流程
    • 3. 准备数据集
    • 4. 训练YOLOv5模型
      • 4.1 下载源码
      • 4.2 安装环境
      • 4.3 修改配置文件
      • 4.4 训练模型
      • 4.5 测试模型
    • 5. 截取车牌
    • 6. 形态学处理
    • 7. Tesseract-OCR安装
      • 7.1 下载 Tesseract-OCR
      • 7.2 配置环境变量
      • 7.3 调用Tesseract-OCR
      • 7.4 显示中文
    • 8. 完整代码
    • 9. 数据集及代码资源
    • 10. 更多YOLOv5实战内容


1. 预期效果

先看看预期的效果吧,大概就是这样子的,输入一张图片可以把图片中的车牌号以文本的形式打印出来。目前还比较简陋,以后可以尝试加个PyQt5页面实现更加丰富的功能。

在这里插入图片描述

在这里插入图片描述


2. 整体流程

  1. 首先训练一个YOLOv5的车牌检测器;
  2. 然后将车牌切下来;
  3. 将切下来的部分通过OpenCV进行形态学处理;
  4. 最后通过Tesseract-OCR识别车牌并在控制台上打印。

3. 准备数据集

这次就不自己标注了,直接找了一个开源的。训练集 245 245 245张、验证集 70 70 70张、测试集 35 35 35张。数据集质量一般。

在这里插入图片描述


4. 训练YOLOv5模型

4.1 下载源码

git clone https://github.com/ultralytics/yolov5

4.2 安装环境

pip install -qr requirements.txt

4.3 修改配置文件

license.yaml

train: D:\Pycharm_Projects\datasets\License\train\images
val: D:\Pycharm_Projects\datasets\License\valid\images

nc: 2
names: ['license-plate', 'vehicle']

4.4 训练模型

数据量比较少,直接用yolov5s跑就可以。

python train.py --weights yolov5s.pt --cfg yolov5s.yaml --datalicense.yaml --epoch 100 --batch-size 16

简单跑了 100 100 100轮,看着还可以,就直接用了。

在这里插入图片描述

4.5 测试模型

python detect.py --source D:\Pycharm_Projects\datasets\License\valid\images --weights runs\train\exp\weights\best.pt

在这里插入图片描述

在这里插入图片描述


5. 截取车牌

python detect.py --source D:\Pycharm_Projects\datasets\License\valid\images --weights runs\train\exp2\weights\best.pt --save-crop --classes 0
在这里插入图片描述在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述在这里插入图片描述

因为数据集质量原因,有一些图拍摄不是很清晰,所以截取到的车牌也不是很清楚,我这里选了一些相对来说清楚一些的。其实到这里我们就可以通过Tesseract-OCR进行识别了,但是不对图像进行处理就识别的话效果很不好,所以我这里还是选择对车牌进行一些形态学处理。


6. 形态学处理

这部分也不算完全意义上的形态学处理吧,我并没有使用腐蚀膨胀等操作,只是使用了几个OpenCV的础操作对车牌进行了处理,大家可以对比一下效果。(其实还有很大的优化空间的)

原始图片处理后
在这里插入图片描述在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述在这里插入图片描述
def Corver_Gray(image_path):
    # 读取模板图像
    img = cv2.imread(image_path)

    # 转换为灰度图 也可读取时直接转换
    ref = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    # 二值图像
    ref = cv2.threshold(ref, 60, 255, cv2.THRESH_BINARY_INV)[1]

    return ref

7. Tesseract-OCR安装

7.1 下载 Tesseract-OCR

在这里插入图片描述

下载地址:Tesseract-OCR

我下载的是最下面的版本,下载好后直接安装就可以,没有什么坑。

在这里插入图片描述

7.2 配置环境变量

在这里插入图片描述

在这里插入图片描述

7.3 调用Tesseract-OCR

在调用前要导入 pytesseract 包。

pip install pytesseract 

随后在YOLOv5项目里新建一个py文件

text = pytesseract.image_to_string(Image.open("test.png"))
print(text)

传入图片的路径后就可以在控制台看到最终输出的结果了。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

7.4 显示中文

如果想显示车牌上的中文,我们还要下载一个东西,下载地址:tessdata/chi_sim.traineddata

在这里插入图片描述

下载好后直接放到如下位置就可以。代码也要改动一下。
在这里插入图片描述

在这里插入图片描述


8. 完整代码

import cv2
from PIL import Image

import pytesseract


def Corver_Gray(image_path):
    # 读取模板图像
    img = cv2.imread(image_path)

    # 转换为灰度图 也可读取时直接转换
    ref = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    # 二值图像
    ref = cv2.threshold(ref, 60, 255, cv2.THRESH_BINARY_INV)[1]

    return ref


def Read_Img(img_path):
    image = Corver_Gray(img_path)
    image = cv2.imwrite("test.png", image)
    return image


Read_Img(r"D:\GitHub\Yolov5_Magic\number\1.png")


text = pytesseract.image_to_string(Image.open("test.png"))
print(text)

9. 数据集及代码资源

在这里插入图片描述

给个赞吧~

链接:https://pan.baidu.com/s/1MKWPpb8dAcZwFQPqjCwTaA?pwd=csdn
提取码:csdn


10. 更多YOLOv5实战内容

更多YOLOv5实战内容可以关注我的专栏

在这里插入图片描述



http://www.niftyadmin.cn/n/5170.html

相关文章

C++ opencv图像存储和MAT容器

1.图像在内存之中的存储方式: 图像矩阵的大小取决于所用的颜色模型,确切说,取决于所用通道数。如果是灰度图像,矩阵就会如图5.1所示。 对于多通道图像来说,矩阵中的列会包含多个子列,其子列个数与通道数相同&#xf…

【优化调度】基于matlab遗传算法求解公交车调度排班优化问题【含Matlab源码 2212期】

⛄ 一、 遗传算法简介 1 引言 公交排班问题是城市公交调度的核心内容,是公交调度人员、司乘人员进行工作以及公交车辆正常运行的基本依据。行车时刻表是按照线路的当前客流量情况,确定发车频率,提供线路车辆的首、末车时间。它是公交企业对社会的承诺,决定着为乘客服务的水平,…

Hadoop的eclipse搭建(客观莫划走,留下来看一眼(适用人群学生初学,其他人看看就行))

前言:Hadoop的eclipse搭建是建立在Hadoop的安装之后进行的,因为Linux上的Hadoop和Windows上的Hadoop版本要求一致,不一致可能会出现某些问题 准备工作:Java的安装包、eclipse的安装包、Hadoop的包(Windows的Hadoop安装…

计算机二级真题练习

1、下面不符合软件设计准则的是()。 A、设计单入口、单出口的模块 B、模块规模尽可能小 C、提高模块的独立性 D、减少模块接口和界面的复杂性 正确答案:B 笞疑:【解析】软件设计准则:Q提高模块独立性;②模块规摸应该适中;③深度、宽度、扇出和扇入都…

【毕业设计】口罩佩戴检测系统 - opencv 卷积神经网络 机器视觉 深度学习

文章目录🚩 0 简介🚩1 课题背景🚩 2 口罩佩戴算法实现2.1 YOLO 模型概览2.2 YOLOv32.3 YOLO 口罩佩戴检测实现2.4 实现代码2.5 检测效果🚩 3 口罩佩戴检测算法评价指标3.1 准确率(Accuracy)3.2 精确率(Prec…

加权黑猩猩优化算法(WChOA)附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。 🍎个人主页:Matlab科研工作室 🍊个人信条:格物致知。 更多Matlab仿真内容点击👇 智能优化算法 …

单片机毕业设计 stm32室内环境温湿度检测系统

文章目录0 简介1 项目介绍2 硬件说明2.1 AB32VG1单片机2.2 DHT22数字温湿度传感器3 代码实现4 实现效果0 简介 🔥 Hi,大家好,这里是丹成学长的毕设系列文章! 🔥 对毕设有任何疑问都可以问学长哦! 这两年开始&#x…

C++ 堆、大顶堆、小顶堆、堆排序

目录一、什么是堆?1.1 大顶堆1.2 小顶堆1.3 自定义greater1.4 堆索引的特点1.5 堆操作添加元素删除最大元素检查序列是否是堆检查部分序列为堆对堆进行排序升序降序问题:sort()和sort_heap()有什么区别二、排序算法:堆排序2.1 堆排序原理创建…