PaddleOCR学习——PP-OCR系列

相关知识前置:

PP-LCNet

PP-LCNetV3

PP-LCNetV3系列模型是PP-LCNet系列模型的延续,覆盖了更大的精度范围,能够适应不同下游任务的需要。PP-LCNetV3系列模型从多个方面进行了优化,提出了可学习仿射变换模块,对重参数化策略、激活函数进行了改进,同时调整了网络深度与宽度。最终,PP-LCNetV3系列模型能够在性能与效率之间达到最佳的平衡,在不同精度范围内取得极致的推理速度。

文本检测

文本检测之DBNet,DBNet++

文本识别

CRNN

SVTR

SVTR不再采用RNN结构,通过引入Transformers结构更加有效地挖掘文本行图像的上下文信息,从而提升文本识别能力。

数学公示识别

CAN

can手写数学公式识别

PP-OCRv2

PP-OCRv3

doc/doc_ch/PP-OCRv3_introduction.md · PaddlePaddle/PaddleOCR - Gitee.com

PP-OCRv4

doc/doc_ch/PP-OCRv4_introduction.md · PaddlePaddle/PaddleOCR - Gitee.com

相关推荐
爱上好庆祝2 小时前
svg图片
前端·css·学习·html·css3
嵌入式小企鹅2 小时前
蓝牙学习系列(八):BLE L2CAP 协议详解
网络·学习·蓝牙·ble·协议栈·l2cap
jiayong233 小时前
第 8 课:开始引入组合式函数
前端·javascript·学习
格鸰爱童话4 小时前
向AI学习项目技能(五)
java·学习
技术人生黄勇4 小时前
拆解 Hermes Agent:开源 Agent 里唯一的闭环学习系统
学习
凉、介4 小时前
别再把 PCIe 的 inbound/outbound、iATU 和 eDMA 混为一谈
linux·笔记·学习·嵌入式·pcie
speop5 小时前
TASK01 | Reasoning Kindom
学习
weixin_6685 小时前
OCR 模型深度对比分析报告 - AI分析
人工智能·ocr
weixin_408099675 小时前
【完整教程】天诺脚本如何调用 OCR 文字识别 API?自动识别屏幕文字实战(附代码)
前端·人工智能·后端·ocr·api·天诺脚本·自动识别文字脚本
2301_822703206 小时前
鸿蒙flutter三方库实战——教育与学习平台:Flutter Markdown
学习·算法·flutter·华为·harmonyos·鸿蒙