C#实现图片文字识别

这几年的AI的发展,使得文字识别难度大大降低、精度大大的提高。百度飞浆就是一个非常好的AI框架,而且是开源的。

我们利用百度飞浆就能快速简单的实现文字识别功能,几行代码就可以集成。

其中百度飞浆的PaddleOCR,就是专门针对文本识别的开发套件,包含的功能有:文本失败、文本检测、表格识别,支持中英文数字组合的识别、竖排、长文本识别,而且还针对小图做了优化,大大提升准确率。

下面我们一起来看看,如何使用百度飞浆实现文字识别:

一、新建项目

新建一个控制台项目。

二、安装依赖包

通过NuGet,安装依赖包:PaddleOCRSharp。

PaddleOCRSharp是Github的开源项目,是基于百度飞浆C++代码封装的.Net类库,其中支持PaddleOCR版本是**release2.5。**如果大家需要最新版本,或者其他模型,也可以自行封装。

项目地址:https://github.com/raoyutian/PaddleOCRSharp

安装依赖后,我们就可以看到很多dll库。

三、编写识别代码

识别图片的文字,并打印,代码如下:

复制代码
using PaddleOCRSharp;

PaddleOCREngine engine;

//中英文模型V3模型
OCRModelConfig config = null;

//OCR参数
OCRParameter oCRParameter = new OCRParameter();
oCRParameter.cpu_math_library_num_threads = 6;//预测并发线程数
oCRParameter.enable_mkldnn = true;//是否使用mkldnn模型
oCRParameter.cls = false; //是否执行文字方向分类
oCRParameter.use_angle_cls = false;//是否开启方向检测
oCRParameter.det_db_score_mode = true;//是否使用多段线,即文字区域是用多段线还是用矩形,
oCRParameter.det_db_unclip_ratio = 1.6f;
oCRParameter.max_side_len = 2000;

//初始化OCR引擎
engine = new PaddleOCREngine(config, oCRParameter);


var imagebyte = File.ReadAllBytes("1.png");
OCRResult ocrResult = engine.DetectText(imagebyte);
Console.WriteLine(ocrResult.Text);

四、执行效果如下

识别速度、效果还是非常好的。

  • End -

推荐阅读

推荐一个支持低代码开发的OA开源系统

一个基于.Net Core+Vue+Element Ui开发的OA系统

一个基于NetCore模块化、多租户CMS系统

一个基于EntityFrameworkCore+Lucene实现的全文搜索引擎库

盘点6个.NetCore+Vue前后端分离的开源项目

相关推荐
Alex艾力的IT数字空间几秒前
完整事务性能瓶颈分析案例:支付系统事务雪崩优化
开发语言·数据结构·数据库·分布式·算法·中间件·php
mjhcsp11 分钟前
C++ 数组:基础与进阶全解析
开发语言·c++
5335ld19 分钟前
后端给的post 方法但是要求传表单数据格式(没有{})
开发语言·前端·javascript·vue.js·ecmascript
量子炒饭大师24 分钟前
【一天一个计算机知识】—— 【编程百度】预处理指令
java·开发语言
任子菲阳32 分钟前
学Java第四十四天——Map实现类的源码解析
java·开发语言
听风吟丶35 分钟前
Java 11+ HttpClient 实战:从 HttpURLConnection 到现代 HTTP 客户端的全面升级
java·开发语言·http
今晚打老虎39 分钟前
c++(斗罗大陆3)
开发语言·c++·斗罗大陆3
mywpython1 小时前
Python使用消息队列rabbitmq
开发语言·python·rabbitmq
hygge9991 小时前
JVM GC 垃圾回收体系完整讲解
java·开发语言·jvm·经验分享·面试