基于YOLO的智能条码识别模型标注与训练

讨论背景

书接上文,介绍了一个简单的AI智能条码识别系统的初步架构以及实现。其中自主模型训练这部分比较简略带过,应掘友的要求,再次做个明细补充和介绍。

上文:《基于YOLO实现一个智能条码识别》

主要标注工具优缺点对比

工具名称 优点 缺点 支持任务类型
LabelImg - 开源免费 - 支持 Pascal VOC 和 YOLO 格式 - 简单轻量 - 功能简单 - 只支持矩形框标注 - 不适合多种任务 目标检测(矩形框)
Labelme - 支持多种标注类型(多边形、线、关键点) - 格式灵活(JSON) - 标注速度慢 - 批量处理功能弱 图像分割、多边形、关键点标注等
CVAT - 功能强大 - Web界面友好 - 支持团队协作 - 支持视频标注 - 安装较复杂(需Docker) - 对计算资源有要求 检测、分割、追踪、关键点等
VIA (VGG Image Annotator) - 无需安装,纯网页运行 - 文件小,开箱即用 - UI不够友好 - 不支持复杂项目管理 检测、分割、多边形、关键点

在这我选择上手简单,开源免费的LabelImg作为我们的标注工具。

准备数据并训练你自己的 YOLO 条码检测模型

📦 第一步:准备条码图片数据集

我们想要识别条形码,那我们就得收集准备足够的条码图片,用于机器学习。图片格式大小尽量统一,不要相差太大,因为我们的上篇文章已经讲到OpenCV对图像进行裁剪,一个图像100x100px,一个图片3200x3200px,规格相差太大是不利于裁剪和识别区域标注的。

  1. 收集10-50张条码图片,多多益善。
  2. 内容越丰富越好(不同角度、背景、光线)。

💡 命名建议:

erlang 复制代码
复制编辑
images/
├── barcode_01.jpg
├── barcode_02.jpg
├── ...

🏷️ 第二步:使用 LabelImg 工具

使用python环境安装LabelImg

复制代码
pip install labelImg

打开工具

复制代码
labelImg

打开界面如下图所示:

使用工具

  1. File菜单下的 "Open Dir" 打开你的图片目录
  2. 点菜单 YOLO,启用 YOLO 格式(坐标将自动保存为 .txt
  3. 开始标注

标注过程

  • 点击 Edit菜单下的create ReactBox开始标注
  • 用鼠标框选图中的条码区域
  • 输入一个类别名:比如 barcode
  • Ctrl+S 保存(会自动生成 .txt 文件)

标注过程示例:

每张图片都会有对应的标签文件,如:

复制代码
复制编辑
barcode_01.jpg
barcode_01.txt

.txt 文件内容格式如下(YOLO 格式):

复制代码
复制编辑
0 0.532 0.651 0.210 0.123

含义为:

  • 类别编号(0 表示"barcode")
  • 中心点 X、Y(归一化 0~1)
  • 宽度、高度(归一化)

📁 第三步:构建 YOLO 数据集结构

创建如下结构:

kotlin 复制代码
复制编辑
barcode_dataset/
├── images/
│   ├── train/
│   └── val/
├── labels/
│   ├── train/
│   └── val/

✅ 第四步:分割数据:

  • 把 80% 图片放到 images/train/
  • 剩下 20% 放到 images/val/
  • .txt 标签文件也要放到对应的 labels/train/labels/val/

📄 第五步:准备 YAML 配置文件

在项目目录下创建 barcode.yaml 文件:

yaml 复制代码
yaml
复制编辑
path: ./barcode_dataset
train: images/train
val: images/val
names:
  0: barcode

开始训练

在命令行中进入你的项目目录,执行以下命令:

ini 复制代码
yolo detect train data=barcode.yaml model=yolov8n.pt epochs=50 imgsz=640 batch=16

参数说明:

参数 说明
data= 配置文件路径(你写的 barcode.yaml
model= 使用的基础模型(yolov8n.pt 比较小)
epochs= 训练轮数,50 一般够用(你可以调高)
imgsz= 输入图像尺寸,默认 640 即可
batch= 批量训练张数(内存小就用 8 或更小)

训练过程示例图:

训练完成

训练完成后,YOLO 会自动创建以下目录结构:

bash 复制代码
runs/detect/train/
├── weights/
│   ├── best.pt       ← 用这个模型来做条码识别
│   └── last.pt
├── results.png       ← 训练过程可视化图   

训练参数:

使用训练好的模型进行识别

回到你之前的 barcode_detect.py 文件,把这行:

ini 复制代码
python
复制编辑
model = YOLO("yolov8n.pt")

替换成:

ini 复制代码
python
复制编辑
model = YOLO("runs/detect/train/weights/best.pt")

然后重新运行这个文件,就可以用你自己训练的模型进行条码区域检测了!

分享

到这整个标注训练过程就已经完成,终于也有了一个属于自己的模型了,是不是有点小激动。要是觉得有趣,赶紧行动起来试试吧。作者自己也算是初步入门,有兴趣的掘友一同进步。在这又有了新的构想,下次把功能做的完善一些,比如开放出来一个接口,供外部api使用。或者打包成一个apk,或者桌面端应用。

相关推荐
费弗里7 小时前
无需云服务器!通过Plotly Cloud免费快捷部署Dash应用
python·dash
用户5191495848457 小时前
揭秘LedgerCTF的AES白盒挑战:逆向工程与密码学分析
人工智能·aigc
用户5191495848457 小时前
SonicWall防火墙安全态势深度分析:固件解密与漏洞洞察
人工智能·aigc
跟橙姐学代码7 小时前
轻松搞定 Python 模块与包导入:新手也能秒懂的入门指南
前端·python·ipython
海森大数据7 小时前
微软发布AI Agent五大可观测性实践,专治智能体“盲跑”难题
人工智能·microsoft
SamDeepThinking7 小时前
使用Cursor生成【财务对账系统】前后端代码
后端·ai编程·cursor
荏苒追寻7 小时前
Python 爬虫——爬虫基础
python
Christo37 小时前
TFS-2003《A Contribution to Convergence Theory of Fuzzy c-Means and Derivatives》
人工智能·算法·机器学习
QT 小鲜肉7 小时前
【QT随笔】结合应用案例一文完美概括QT中的队列(Queue)
c++·笔记·qt·学习方法·ai编程
wdfk_prog7 小时前
Python脚本深度解析:实现基于YMODEM的单片机固件自动化升级
python·单片机·自动化