相关知识前置:
PP-LCNet
PP-LCNetV3
PP-LCNetV3系列模型是PP-LCNet系列模型的延续,覆盖了更大的精度范围,能够适应不同下游任务的需要。PP-LCNetV3系列模型从多个方面进行了优化,提出了可学习仿射变换模块,对重参数化策略、激活函数进行了改进,同时调整了网络深度与宽度。最终,PP-LCNetV3系列模型能够在性能与效率之间达到最佳的平衡,在不同精度范围内取得极致的推理速度。
文本检测
文本检测之DBNet,DBNet++
文本识别
SVTR不再采用RNN结构,通过引入Transformers结构更加有效地挖掘文本行图像的上下文信息,从而提升文本识别能力。
数学公示识别
CAN
PP-OCRv2
PP-OCRv3
doc/doc_ch/PP-OCRv3_introduction.md · PaddlePaddle/PaddleOCR - Gitee.com
PP-OCRv4
doc/doc_ch/PP-OCRv4_introduction.md · PaddlePaddle/PaddleOCR - Gitee.com