PaddleOCR学习——PP-OCR系列

相关知识前置:

PP-LCNet

PP-LCNetV3

PP-LCNetV3系列模型是PP-LCNet系列模型的延续,覆盖了更大的精度范围,能够适应不同下游任务的需要。PP-LCNetV3系列模型从多个方面进行了优化,提出了可学习仿射变换模块,对重参数化策略、激活函数进行了改进,同时调整了网络深度与宽度。最终,PP-LCNetV3系列模型能够在性能与效率之间达到最佳的平衡,在不同精度范围内取得极致的推理速度。

文本检测

文本检测之DBNet,DBNet++

文本识别

CRNN

SVTR

SVTR不再采用RNN结构,通过引入Transformers结构更加有效地挖掘文本行图像的上下文信息,从而提升文本识别能力。

数学公示识别

CAN

can手写数学公式识别

PP-OCRv2

PP-OCRv3

doc/doc_ch/PP-OCRv3_introduction.md · PaddlePaddle/PaddleOCR - Gitee.com

PP-OCRv4

doc/doc_ch/PP-OCRv4_introduction.md · PaddlePaddle/PaddleOCR - Gitee.com

相关推荐
非凡ghost2 小时前
AMS PhotoMaster:全方位提升你的照片编辑体验
windows·学习·信息可视化·软件需求
云间月13144 小时前
飞算JavaAI智慧教育场景实践:从个性化学习到教学管理的全链路技术革新
学习·飞算javaai挑战赛
weixin_456904275 小时前
一文讲清楚Pytorch 张量、链式求导、正向传播、反向求导、计算图等基础知识
人工智能·pytorch·学习
Python私教6 小时前
从“Hello World”到“高并发中间件”:Go 语言 2025 系统学习路线图
学习·中间件·golang
代码AI弗森8 小时前
PDF OCR + 大模型:让文档理解不止停留在识字
pdf·ocr
Brookty9 小时前
【Java学习】锁、线程死锁、线程安全2
java·开发语言·学习·java-ee
HalvmånEver15 小时前
在 C++ :x86(32 位)和 x64(64 位)的不同
开发语言·c++·学习
艾伦~耶格尔18 小时前
【数据结构进阶】
java·开发语言·数据结构·学习·面试
Janspran19 小时前
嵌入式linux学习 -- 进程和线程
linux·运维·学习