OCR识别系统 YOLOv8 +Paddle 方案落地

YOLOv8 + PaddleOCR 技术方案落地

  • Yolov8相关文档
    • [Step 1 证件模型的训练](#Step 1 证件模型的训练)
    • [Step 2 Yolov8进行图片推理](#Step 2 Yolov8进行图片推理)
    • [Step 3 PaddleOCR进行识别](#Step 3 PaddleOCR进行识别)
    • [Step 4 整合Yolov8 + PaddleOCR 进行OCR](#Step 4 整合Yolov8 + PaddleOCR 进行OCR)

Yolov8相关文档

《yolov8 官方网站》
《Yolov8 保姆级别安装》

Ultralytics YOLOv8 是一款尖端的、最先进的 (SOTA) 模型,它以之前 YOLO 版本的成功为基础,并引入了新功能和改进,以进一步提高性能和灵活性。YOLOv8 旨在快速、准确且易于使用,使其成为各种对象检测和跟踪、实例分割、图像分类和姿势估计任务的绝佳选择
目前市面的OCR功能都已经比较完善了,Paddle也很出众,不过OCR出来后相关字段都是错乱,你通过正则表达式获取也不能满足特殊场景,那么就需要特别的位置检测。yolov家族就是做这个事情的!!,通过图片相关位置截取图片在进行OCR

Step 1 证件模型的训练

1、选取身份证标注 (300张样本,200张测试样本)

2、使用标注软件进行处理数据集(这里我用的是 makesense)

3、yolov8 进行训练模型 (这里可以参考《Yolov8 保姆级别安装》文章 )

python 复制代码
yolo detect train model=yolov8n.pt data=idCard.yaml epochs=10 imgsz=640

样图:

Step 2 Yolov8进行图片推理

python 复制代码
yolo predict model=best.pt  source=image_test imgsz=640 

检测后效果:

Step 3 PaddleOCR进行识别

python 复制代码
paddleocr --image_dir ./imges/test.jpg --use_angle_cls true --use_gpu false 

\[\[28.0, 37.0\], \[302.0, 39.0\], \[302.0, 72.0\], \[27.0, 70.0\]\], ('姓名 xxxxxxx', 0.9658738374710083)

...

到这里相关操作都能正常运行,那么你的虚拟环境就好了。

Step 4 整合Yolov8 + PaddleOCR 进行OCR

1、通过Flask整合,通过http接口进行交互识别

python 复制代码
"""
三大核心包
"""
from flask import Flask, request
from ultralytics import YOLO
from paddleocr import PaddleOCR

//yolov 推理
model_idCard = YOLO('best_idCard.pt')
results = model_idCard.predict(img, device='cpu', stream=True)
....

//获取yolov推理后的切片图进行ocr
ocr = PaddleOCR(lang='ch', use_angle_cls=True, enable_mkldnn=True, cpu_threads=8, ocr_version='PP-OCRv4')
result = ocr.ocr(img, cls=True)



@app.route('/idCardOcr', methods=['POST'])
def idCardOcrRequest():
# f = request.files['file']
 json = request.json
 imagePath = 'temp/' + json['fileName']
 # imagePath = 'D:/work_project/useDeviceCloud/temp/' + json['fileName']
 return idCardOcr(imagePath)

yolov8推理出来的切图

效果:

效果还是比较可以的,不过低配置的机器可能有点限制。paddle要求比较高后续看看在接入其他的ocr通用版本来替换,让更多的机器能跑起来

看↓↓↓方格或搜索: 码猿趣事,回复关键字:yolov8+OCR持续更新中~。

相关推荐
Sour10 天前
PDF翻译卡住不动怎么办?扫描件、OCR 和大文件排查清单
前端·pdf·ocr
大鱼>10 天前
地平线BPU部署实战:YOLOv8在J5/X3上的算法适配与性能优化
算法·yolo·性能优化
stsdddd10 天前
YOLO系列目标检测数据集大全【第二十九期】
yolo·目标检测·目标跟踪
大鱼>10 天前
YOLO边缘部署深度指南:从YOLOv8n到NPU加速的全链路优化
yolo·aiot
AI棒棒牛10 天前
第 03 讲《监督学习:数据、标签、Loss与训练循环》
人工智能·学习·yolo·目标检测·yolo26
FL162386312910 天前
国内快递面单识别检测数据集VOC+YOLO格式422张6类别
人工智能·yolo·机器学习
stsdddd10 天前
YOLO系列目标检测数据集大全【第三十期】
yolo·目标检测·目标跟踪
YOLO数据集集合10 天前
无人机航拍地质灾害智能识别 山体滑坡实例分割数据集落地实战 | 泥石流监测 道路险情封堵 深度学习模型训练方案10296期
人工智能·深度学习·yolo·目标检测·无人机
音沐mu.10 天前
【73】墙壁建筑缺陷数据集(有v5/v8模型)/YOLO墙壁建筑缺陷检测
yolo·目标检测·目标检测数据集·墙壁建筑缺陷数据集·墙壁建筑缺陷检测
旗讯数字10 天前
旗讯 OCR 工业手写识别解决方案|破解车间纸质表单录入难题,加速生产数字化转型
大数据·ocr