记录paddlepaddleOCR从环境到使用默认模型,再训练自己的数据微调模型再推理

启动paddlelabel:

python 复制代码
(ppocrlabelpy310) C:\develop\PythonEnvs\anaconda3\envs\ppocrlabelpy310>PPOCRLabel --lang ch > error.log 2>&1

会等几分钟才能启动,我的挺慢的

标注好之后,点导出标记结果和导出识别结果

开始划分数据集:

直接执行也可:

python 复制代码
python gen_ocr_train_val_test.py --trainValTestRatio 6:2:2 --datasetRootPath ./train_data/

训练脚本:

python 复制代码
python tools/train.py -c pretrain_models/PP-OCRv5_server_rec.yml -o Global.pretrained_model=pretrain_models/PP-OCRv5_server_rec_pretrained.pdparams Global.print_batch_step=1

导出识别模型:

python 复制代码
python tools/export_model.py -c pretrain_models/PP-OCRv5_server_rec.yml -o Global.pretrained_model=D:\Projects_Datas\HIMA15\ppocrpro\PaddleOCR\output\PP-OCRv5_server_rec\best_model\model.pdparams Global.save_inference_dir="./inference_model/rec/"
相关推荐
得物技术13 分钟前
从狂野代码到按目标生产:得物推荐 AI Harness 的工程化实践|AICon 演讲整理
人工智能·算法·架构
HokKeung17 分钟前
飞书 lark-cli 如何存储 tenant_access_token 和 user_access_token
人工智能·go
Ralph_Salar19 分钟前
从0到1搭建AI智能支付风控助手Stage3-Function Calling — 让AI能动起来
人工智能
Ralph_Salar24 分钟前
从0到1搭建AI智能支付风控助手Stage4-Agent编排 — 让AI自己思考、决策、行动
人工智能
smallyoung25 分钟前
Spring AI 2.0 VectorStore实战:从原理到RAG落地
人工智能·后端
火山引擎开发者社区1 小时前
被 Vibe Coding 用户频点名的火山 Supabase 到底是个啥?一图来看懂
人工智能
火山引擎开发者社区1 小时前
动手做 AI 实验赢好礼!产品 + 大模型免费额度限时供应!
人工智能
字节跳动视频云技术团队2 小时前
从 VCloud 到 Agentic VCloud:Agent 时代的范式重构
人工智能·音视频开发
AKAMAI2 小时前
每百万 Token 成本砍六成,出海 AI 团队开始重算推理这笔账
人工智能·云计算
用户938515635073 小时前
从 Prompt 到 Harness:AI 工程化的三年跃迁与实战解码
javascript·人工智能