rapidocr v3.0.0发布(集成PP-OCRv5)

引言

rapidocrv3.0.0已经发布到pypi了,小伙伴们可以安装使用了。

在这里,我想先强调一下,rapidocrv3.0与v2.0系列主要区别:

  • 集成了PP-OCRv5系列模型,包括mobile/server文本检测模型和mobile/server文本识别模型
  • 传入参数的不同,变动原因是之前参数设计不太合理,在集成PP-OCRv5过程中就体现出来的。

总结来说,这次升级与v2.0不兼容,大家请慎重考虑升级。

安装

ini 复制代码
pip install rapidocr==3.0.0

# 便于快速验证,后续看自己安装需要的推理引擎
pip install onnxruntime 

验证是否安装成功:

bash 复制代码
rapidocr check

# Success! rapidocr is installed correctly!

使用

此次更新,重新调整了参数,从而可以支持不同阶段可以使用不同推理引擎、不同版本的OCR模型等多种组合,灵活满足需求。

由于PP-OCRv5 在自建测评集中,并没有特别突出,因为考虑默认配置仍然是PP-OCRv4rapidocrv3.0.0三个阶段的默认配置均是如下:

vbnet 复制代码
engine_type: 'onnxruntime'
lang_type: 'ch'
model_type: 'mobile'
ocr_version: 'PP-OCRv4'

想要使用PP-OCRv5的小伙伴,可以按照下面参数来使用:

makefile 复制代码
from rapidocr import EngineType, LangDet, LangRec, ModelType, OCRVersion, RapidOCR

engine = RapidOCR(
    params={
        "Det.engine_type": EngineType.TORCH,
        "Det.lang_type": LangDet.CH,
        "Det.model_type": ModelType.MOBILE,
        "Det.ocr_version": OCRVersion.PPOCRV5,
        "Rec.engine_type": EngineType.PADDLE,
        "Rec.lang_type": LangRec.CH,
        "Rec.model_type": ModelType.MOBILE,
        "Rec.ocr_version": OCRVersion.PPOCRV5,
    }
)


img_url = "https://img1.baidu.com/it/u=3619974146,1266987475&fm=253&fmt=auto&app=138&f=JPEG?w=500&h=516"
result = engine(img_url)
print(result)

result.vis("vis_result.jpg")

从上面来看,似乎变得更加繁琐了。但是随着引入了EngineTypeModelTypeOCRVersionLangDetLangRecLangCls枚举类,我们可以更加灵活地使用不同模型了。

这几个参数基本可以任意组合,当然前提是要有对应的模型。为此,我也更新了对应文档中的模型列表文档(rapidai.github.io/RapidOCRDoc...

同时,对应的在线demo也在更新中了,后续会逐步上线,小伙伴遇到需要OCR的图像时,不妨先在在线demo上快速查看某些场景图像的效果,从而方便决定用哪个参数,哪个模型

由于官方文档站点已经尽量详细地介绍如何使用v3.0系列模型了。在这里,我不再过多赘述,欢迎小伙伴们前往文档站点查看。(rapidai.github.io/RapidOCRDoc...)

相关文档

相关推荐
旖-旎10 分钟前
深搜(二叉树的所有路径)(6)
c++·算法·leetcode·深度优先·递归
啦啦啦_999919 分钟前
3. KNN算法之 常用的距离度量方式(欧式&曼哈顿&切比雪夫&闵式距离)
算法
朝风工作室33 分钟前
实时全景拼接|支持任意路数输入,8*8K RTX3050 实测 10ms 内
图像处理·算法·计算机视觉
nianniannnn1 小时前
HNU计算机系统期中题库详解(五)位运算与逻辑运算
算法·位运算·计算机系统
徐新帅2 小时前
4181:【GESP2603七级】拆分
c++·学习·算法·信奥赛
黎梨梨梨_2 小时前
C++入门基础(下)(重载,引用,inline,nullptr)
开发语言·c++·算法
Jasmine_llq2 小时前
《B4411 [GESP202509 二级] 优美的数字》
算法·暴力枚举算法·逐位校验算法·统一数位判断算法·条件计数算法·自定义函数判断算法
做时间的朋友。2 小时前
小华地图寻宝
算法
贾斯汀玛尔斯2 小时前
每天学一个算法--单调栈(Monotonic Stack)
运维·服务器·算法
ZPC82102 小时前
ROS2 速度远快于 UDP的完整方案(同机节点)
人工智能·算法·计算机视觉·机器人