C#描述-计算机视觉OpenCV(8):OCR字符检测

文章目录


前言

OCR识别广泛的运用于工业生产与互联网中。本篇从一个C#上位机的视角,来做一下识别测试,虽然现在配套工业相机识别的软件很多,可能我们只需要调用输出的结果或者信号,但是在一些生产中可能需要OCR算法与上位机本身深度绑定

环境配置

在NuGet上安装OpenCv与Tesseract

添加引用:

csharp 复制代码
using OpenCvSharp;   
using Tesseract;

OCR算法使用

Tesseract库已经形成了非常成熟的OCR识别算法,在测试时,我们只需要做好图片预处理,然后调用函数即可。

算法调用:

csharp 复制代码
Mat img1 = new Mat("001.jpg", ImreadModes.Color);
Mat res = new Mat();
var engine = new TesseractEngine(@"tessdata", "eng", EngineMode.Default);
// 设置识别参数
engine.SetVariable("tessedit_char_whitelist","ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789");
// 将OpenCV Mat转换为Tesseract Pix
var pix = Pix.LoadFromMemory(img1.ToBytes(".jpg"));
var page = engine.Process(pix);
string text = page.GetText();
textBox1.Text = text;

在此需注意,我们要自行去下载一套tessdata的字符识别库,下面收集了一套下载方案:

https://github.com/tesseract-ocr(GitHub自行找版本下载)

https://github.com/tesseract-ocr/tessdata_best/raw/main/eng.traineddata(英文识别库直接下载)

https://github.com/tesseract-ocr/tessdata_best/raw/main/chi_sim.traineddata(简中识别直接下载)

下载好后有如下添加方式:

1:放在项目根目录(推荐)

string tessDataPath = @"./tessdata"; // 或 "tessdata"(相对路径)

2:放在程序运行目录(部署后使用)

string exePath = AppDomain.CurrentDomain.BaseDirectory;

string tessDataPath = Path.Combine(exePath, "tessdata");

3:使用完整路径

string tessDataPath = @"D:\MyProject\OCRApp\tessdata";

函数添加地址示例:

csharp 复制代码
var engine = new TesseractEngine(@"C:\Users\Desktop\TestOpenCV\tessdata", "eng", EngineMode.Default);

实例测试

一般来说我们可以去做一些二值化或者放大的处理,我挂了个灰度处理然后直接测试一下

这是我曾经的一个工程实践中的OCR案例,

结果:

识别基本正确,在工程实践中要注意,相似字母、字符的识别,例如O与0,G与6,一般来说建议规范化需求。

后续可能会更新一些更细节的精度识别方法

相关文章

图像的二值化与其他形态学处理可以看看前文:
C#描述-计算机视觉OpenCV(7):MSER特征检测
C#描述-计算机视觉OpenCV(6):形态学
C#描述-计算机视觉OpenCV(5):直方图算法
C#描述-计算机视觉OpenCV(4):图像分割

相关推荐
这张生成的图像能检测吗11 小时前
(论文速读)让机器人像人一样走路:注意力机制如何让腿足机器人征服复杂地形
人工智能·深度学习·计算机视觉·机器人控制
日光明媚11 小时前
torch.compile 与 Triton 的加速本质:从原理到实际效果
人工智能·python·计算机视觉·stable diffusion·aigc
sali-tec12 小时前
C# 基于OpenCv的视觉工作流-章57-人脸识别
图像处理·人工智能·opencv·算法·计算机视觉
枫叶丹412 小时前
【HarmonyOS 6.0】Camera Kit 新增系统性能压力监听功能全解析
开发语言·计算机视觉·华为·harmonyos
深念Y13 小时前
Python + PyAutoGUI 实现一键清理:从 OpenCV 图像识别到“按键精灵“的自动化之路
python·opencv·自动化·codex·claudecode·skills·ccswitch
William_cl13 小时前
【C#/.NET 进阶】ASP.NET 架构与最佳实践:DI 依赖注入(IoC 核心)从入门到避坑
c#·asp.net·.net
武藤一雄13 小时前
WPF:MessageBox系统消息框
前端·microsoft·c#·.net·wpf
武藤一雄13 小时前
WPF进阶:万字详解WPF如何性能优化
windows·性能优化·c#·.net·wpf·.netcore·鲁棒性
www_comsci1 天前
【生物EI会议】2026年计算机技术与生物医学国际学术会议(CTBS 2026)
图像处理·神经网络·计算机视觉
yong99901 天前
图像融合与拼接:完整MATLAB工具箱
算法·计算机视觉·matlab