记录paddlepaddleOCR从环境到使用默认模型,再训练自己的数据微调模型再推理

启动paddlelabel:

python 复制代码
(ppocrlabelpy310) C:\develop\PythonEnvs\anaconda3\envs\ppocrlabelpy310>PPOCRLabel --lang ch > error.log 2>&1

会等几分钟才能启动,我的挺慢的

标注好之后,点导出标记结果和导出识别结果

开始划分数据集:

直接执行也可:

python 复制代码
python gen_ocr_train_val_test.py --trainValTestRatio 6:2:2 --datasetRootPath ./train_data/

训练脚本:

python 复制代码
python tools/train.py -c pretrain_models/PP-OCRv5_server_rec.yml -o Global.pretrained_model=pretrain_models/PP-OCRv5_server_rec_pretrained.pdparams Global.print_batch_step=1

导出识别模型:

python 复制代码
python tools/export_model.py -c pretrain_models/PP-OCRv5_server_rec.yml -o Global.pretrained_model=D:\Projects_Datas\HIMA15\ppocrpro\PaddleOCR\output\PP-OCRv5_server_rec\best_model\model.pdparams Global.save_inference_dir="./inference_model/rec/"
相关推荐
机器之心14 分钟前
Generalist之后,罗剑岚团队推出LWD,也要变革具身智能训练范式
人工智能·openai
IT_陈寒19 分钟前
Vite的public文件夹放静态资源?这坑我替你踩了
前端·人工智能·后端
传说故事19 分钟前
【论文阅读】Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion
论文阅读·人工智能·diffusion
xixixi7777723 分钟前
三重筑基:5G-A超级上行提速千兆,电联低频共享扫平盲点,800V HVDC算电协同破局
人工智能·5g·ai·大模型·算力·通信·信通院
jkyy201424 分钟前
AI运动数字化:以技术重塑场景,健康有益赋能全域运动健康管理
大数据·人工智能·健康医疗
金融小师妹32 分钟前
4月30日多因子共振节点:鲍威尔“收官效应”与权力结构重塑的预期重构
大数据·人工智能·重构·逻辑回归
2601_9499251837 分钟前
AI Agent如何重构跨境物流的决策?
大数据·人工智能·重构·ai agent·geo优化·物流科技
AI木马人44 分钟前
1.人工智能实战:大模型推理接口响应慢?从模型加载到 FastAPI 部署的完整优化方案
人工智能·python·fastapi
Black蜡笔小新1 小时前
私有化本地化AI模型训推工作站DLTM训推一体工作站赋能多行业智能化落地
人工智能
qq_411262421 小时前
四博 AI 智能音箱 + ESPC3 Tasmota 计量通断器方案
人工智能·智能音箱