PaddleOCR学习——PP-OCR系列

相关知识前置:

PP-LCNet

PP-LCNetV3

PP-LCNetV3系列模型是PP-LCNet系列模型的延续,覆盖了更大的精度范围,能够适应不同下游任务的需要。PP-LCNetV3系列模型从多个方面进行了优化,提出了可学习仿射变换模块,对重参数化策略、激活函数进行了改进,同时调整了网络深度与宽度。最终,PP-LCNetV3系列模型能够在性能与效率之间达到最佳的平衡,在不同精度范围内取得极致的推理速度。

文本检测

文本检测之DBNet,DBNet++

文本识别

CRNN

SVTR

SVTR不再采用RNN结构,通过引入Transformers结构更加有效地挖掘文本行图像的上下文信息,从而提升文本识别能力。

数学公示识别

CAN

can手写数学公式识别

PP-OCRv2

PP-OCRv3

doc/doc_ch/PP-OCRv3_introduction.md · PaddlePaddle/PaddleOCR - Gitee.com

PP-OCRv4

doc/doc_ch/PP-OCRv4_introduction.md · PaddlePaddle/PaddleOCR - Gitee.com

相关推荐
brave and determined7 小时前
接口通讯学习(day05):智能手机的内部高速公路:揭秘MIPI CSI与DSI技术
学习·智能手机·软件工程·制造·csi·mipi·dsi
Tonya4311 小时前
测开学习DAY37
学习
翔云 OCR API16 小时前
人脸识别API开发者对接代码示例
开发语言·人工智能·python·计算机视觉·ocr
roman_日积跬步-终至千里17 小时前
【强化学习基础(2)】被动强化学习:学习价值函数
学习
逢考必过@k17 小时前
6级550学习ing
学习
陈天伟教授19 小时前
基于学习的人工智能(7)机器学习基本框架
人工智能·学习
Z***G47920 小时前
网络爬虫学习:借助DeepSeek完善爬虫软件,实现模拟鼠标右键点击,将链接另存为本地文件
爬虫·学习·计算机外设
我命由我1234521 小时前
微信开发者工具 - 模拟器分离窗口与关闭分离窗口
前端·javascript·学习·微信小程序·前端框架·html·js
DKPT21 小时前
ZGC和G1收集器相比哪个更好?
java·jvm·笔记·学习·spring