OCR 字符识别助手详解（含 Halcon 示例）

一、OCR 字符识别概述

OCR（Optical Character Recognition，光学字符识别）是将图像中的印刷体或手写体字符转换为可编辑文本的技术。Halcon 提供了专门的OCR 助手（OCR Assistant），通过可视化流程简化字符识别模型的训练、测试与部署，适用于工业检测、文档数字化等场景。

二、OCR 字符识别的核心流程

图像预处理：校正倾斜、去噪、增强对比度，确保字符清晰可辨；
字符分割：将图像中的字符区域从背景中分离，单个字符独立成区；
特征提取：提取字符的形状、轮廓、灰度分布等特征；
模型训练：用已知字符样本训练分类器，建立特征与字符的映射关系；
字符识别：对未知字符提取特征，通过分类器匹配并输出结果。

三、Halcon OCR 助手的功能与优势

1. 核心功能

支持印刷体字符（数字、字母、符号、多国语言）识别；
可视化完成字符样本采集、特征训练、识别参数调优；
自动生成可复用的 Halcon 代码，快速集成到项目中；
支持字符旋转、缩放、轻微形变的鲁棒识别。

2. 优势

无需手动编写复杂的特征提取与分类代码；
内置多种特征类型（如轮廓、灰度、梯度）和分类器（如 SVM、KNN）；
支持批量测试与精度评估，便于优化模型。

四、Halcon OCR 助手使用步骤

1. 打开 OCR 助手

运行 Halcon 后，依次点击：助手 → 打开新的OCR，打开 OCR 助手界面（包含 "训练""检测""代码生成" 三个标签页）。

2. 训练模型（核心步骤）

（1）加载样本图像

点击 "加载图像"，导入包含目标字符的样本图像（建议包含不同字体、光照的样本，提高模型鲁棒性）。

（2）字符分割与样本采集

手动分割：用矩形工具框选单个字符，在 "字符" 栏输入对应文本（如 "0""A"），点击 "添加样本"；
自动分割：若字符排列规则（如单行文本），可通过 "自动分割" 功能批量提取字符（需先设置分割参数，如字符高度范围）。

（3）选择特征与分类器

特征类型 ：推荐 "轮廓 + 灰度" 组合（'contour+gray'），兼顾形状与灰度信息；
分类器：默认使用 SVM（支持向量机），适用于多数场景；对于简单字符，可选择 KNN（计算更快）。

（4）训练模型

点击 "训练" 按钮，系统基于样本生成 OCR 模型（.omc格式），可保存模型供后续调用。

3. 检测与测试

在 "检测" 标签页加载测试图像，点击 "执行"，助手自动识别字符并显示结果（包括识别文本、置信度、位置）；
若识别错误，可返回 "训练" 页补充样本重新训练，或调整分割参数（如字符尺寸范围）。

4. 生成代码

在 "代码生成" 标签页点击 "生成"，自动生成包含模型训练、字符识别的完整 Halcon 程序，可直接运行或集成到项目中。

五、Halcon OCR 核心算子及示例

1. 核心算子

算子	功能
`read_ocr_class_mlp`	读取预训练的 OCR 分类器模型
`do_ocr_multi_class_mlp`	对多个字符区域执行 OCR 识别
`create_ocr_class_mlp`	创建 OCR 分类器（手动训练时使用）
`train_ocr_class_mlp`	训练 OCR 分类器
`segment_characters`	自动分割字符区域

2. 示例：数字识别（基于 OCR 助手生成代码）

复制代码

dev_update_off ()
* 读取图像
read_image (Image, 'digit_image.png')
dev_close_window ()
get_image_size (Image, Width, Height)
dev_open_window (0, 0, Width, Height, 'black', WindowHandle)
dev_set_font (WindowHandle, 'mono', 16, 'true', 'false')

* 预处理：二值化与去噪
threshold (Image, Region, 100, 255)  // 假设字符为亮色，背景为暗色
connection (Region, ConnectedRegions)
select_shape (ConnectedRegions, Characters, ['area','height'], 'and', [50,20], [500,80])  // 筛选字符区域

* 读取OCR模型（由OCR助手训练生成）
read_ocr_class_mlp ('digit_ocr_model.omc', OCRHandle)

* 执行OCR识别
do_ocr_multi_class_mlp (Characters, Image, OCRHandle, Class, Confidence)

* 显示结果
dev_display (Image)
dev_set_color ('green')
for i := 0 to |Class| - 1 by 1
    area_center (Characters[i], Area, Row, Column)
    disp_message (WindowHandle, Class[i] + ' (' + Confidence[i]$'3.2f' + ')', 'image', Row-10, Column, 'green', 'true')
endfor

* 释放资源
clear_ocr_class_mlp (OCRHandle)
stop ()

六、优化 OCR 识别精度的技巧

样本多样性：训练样本需包含目标场景中可能出现的字体、大小、倾斜角度、光照变化；
预处理优化：
- 对倾斜文本进行仿射变换校正 （proj_match_points_ransac）；
- 用形态学操作 （closing/opening）去除噪声，增强字符边缘；
分割优化 ：确保字符无粘连、无断裂，可通过expand_region或shrink_region调整区域；
特征选择：复杂场景优先用 "轮廓 + 梯度" 特征，简单场景可用 "灰度" 特征提速。

七、总结

Halcon OCR 助手通过可视化流程降低了字符识别的技术门槛，结合预处理与模型优化，可实现高精度的印刷体字符识别。核心步骤包括样本采集、模型训练、测试优化，最终通过自动生成的代码快速部署到实际应用中。