PaddleOCR学习——PP-OCR系列

TYUT_xiaoming2024-06-18 0:39

相关知识前置：

PP-LCNet

PP-LCNetV3

PP-LCNetV3系列模型是PP-LCNet系列模型的延续，覆盖了更大的精度范围，能够适应不同下游任务的需要。PP-LCNetV3系列模型从多个方面进行了优化，提出了可学习仿射变换模块，对重参数化策略、激活函数进行了改进，同时调整了网络深度与宽度。最终，PP-LCNetV3系列模型能够在性能与效率之间达到最佳的平衡，在不同精度范围内取得极致的推理速度。

文本检测

文本检测之DBNet，DBNet++

文本识别

SVTR不再采用RNN结构，通过引入Transformers结构更加有效地挖掘文本行图像的上下文信息，从而提升文本识别能力。

数学公示识别

CAN

can手写数学公式识别

PP-OCRv2

PP-OCRv3

doc/doc_ch/PP-OCRv3_introduction.md · PaddlePaddle/PaddleOCR - Gitee.com

PP-OCRv4

doc/doc_ch/PP-OCRv4_introduction.md · PaddlePaddle/PaddleOCR - Gitee.com

上一篇：又跳槽！3年Java经验收割成都大厂的面试心得(干货满满&文末有福利)

下一篇：wireshark抓包ssl数据出现ignored unknown record的原因

热门推荐

01GitHub 镜像站点 022026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 03如何新建文件夹？电脑新建文件夹的4种方法 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI科技热点日报 | 2026年07月01日 06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 07幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 08微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 09【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……102026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？