相关知识前置:
PP-LCNet
PP-LCNetV3
PP-LCNetV3系列模型是PP-LCNet系列模型的延续,覆盖了更大的精度范围,能够适应不同下游任务的需要。PP-LCNetV3系列模型从多个方面进行了优化,提出了可学习仿射变换模块,对重参数化策略、激活函数进行了改进,同时调整了网络深度与宽度。最终,PP-LCNetV3系列模型能够在性能与效率之间达到最佳的平衡,在不同精度范围内取得极致的推理速度。
文本检测
文本检测之DBNet,DBNet++
文本识别
![](https://img-blog.csdnimg.cn/direct/28ae2480307f418781b7fc197c33ff7a.png)
SVTR不再采用RNN结构,通过引入Transformers结构更加有效地挖掘文本行图像的上下文信息,从而提升文本识别能力。
![](https://img-blog.csdnimg.cn/direct/37e392d3ede64fc0bbf535230890da5e.png)
数学公示识别
CAN
PP-OCRv2
![](https://img-blog.csdnimg.cn/direct/54dde05776d94f798013a85d9410a4eb.png)
PP-OCRv3
doc/doc_ch/PP-OCRv3_introduction.md · PaddlePaddle/PaddleOCR - Gitee.com
![](https://img-blog.csdnimg.cn/direct/ff14621c6c144cb5b85ecf01d669a675.png)
PP-OCRv4
doc/doc_ch/PP-OCRv4_introduction.md · PaddlePaddle/PaddleOCR - Gitee.com
![](https://img-blog.csdnimg.cn/direct/bf87c6ae185b48a2a494da594f759efe.png)