记录paddlepaddleOCR从环境到使用默认模型，再训练自己的数据微调模型再推理

grant-ADAS2026-03-20 23:42

启动paddlelabel:

python 复制代码

(ppocrlabelpy310) C:\develop\PythonEnvs\anaconda3\envs\ppocrlabelpy310>PPOCRLabel --lang ch > error.log 2>&1

会等几分钟才能启动，我的挺慢的

标注好之后，点导出标记结果和导出识别结果

开始划分数据集：

直接执行也可：

python 复制代码

python gen_ocr_train_val_test.py --trainValTestRatio 6:2:2 --datasetRootPath ./train_data/

训练脚本：

python 复制代码

python tools/train.py -c pretrain_models/PP-OCRv5_server_rec.yml -o Global.pretrained_model=pretrain_models/PP-OCRv5_server_rec_pretrained.pdparams Global.print_batch_step=1

导出识别模型：

python 复制代码

python tools/export_model.py -c pretrain_models/PP-OCRv5_server_rec.yml -o Global.pretrained_model=D:\Projects_Datas\HIMA15\ppocrpro\PaddleOCR\output\PP-OCRv5_server_rec\best_model\model.pdparams Global.save_inference_dir="./inference_model/rec/"

上一篇：MySQL 服务基础

下一篇：MQTT通信协议业务层实现的完整开发流程