记录paddlepaddleOCR从环境到使用默认模型,再训练自己的数据微调模型再推理

启动paddlelabel:

python 复制代码
(ppocrlabelpy310) C:\develop\PythonEnvs\anaconda3\envs\ppocrlabelpy310>PPOCRLabel --lang ch > error.log 2>&1

会等几分钟才能启动,我的挺慢的

标注好之后,点导出标记结果和导出识别结果

开始划分数据集:

直接执行也可:

python 复制代码
python gen_ocr_train_val_test.py --trainValTestRatio 6:2:2 --datasetRootPath ./train_data/

训练脚本:

python 复制代码
python tools/train.py -c pretrain_models/PP-OCRv5_server_rec.yml -o Global.pretrained_model=pretrain_models/PP-OCRv5_server_rec_pretrained.pdparams Global.print_batch_step=1

导出识别模型:

python 复制代码
python tools/export_model.py -c pretrain_models/PP-OCRv5_server_rec.yml -o Global.pretrained_model=D:\Projects_Datas\HIMA15\ppocrpro\PaddleOCR\output\PP-OCRv5_server_rec\best_model\model.pdparams Global.save_inference_dir="./inference_model/rec/"
相关推荐
美酒没故事°15 小时前
Open WebUI安装指南。搭建自己的自托管 AI 平台
人工智能·windows·ai
云烟成雨TD15 小时前
Spring AI Alibaba 1.x 系列【6】ReactAgent 同步执行 & 流式执行
java·人工智能·spring
简简单单做算法15 小时前
基于GA遗传优化的Transformer-LSTM网络模型的时间序列预测算法matlab性能仿真
深度学习·matlab·lstm·transformer·时间序列预测·ga遗传优化·电池剩余寿命预测
AI攻城狮15 小时前
用 Obsidian CLI + LLM 构建本地 RAG:让你的笔记真正「活」起来
人工智能·云原生·aigc
鸿乃江边鸟15 小时前
Nanobot 从onboard启动命令来看个人助理Agent的实现
人工智能·ai
lpfasd12315 小时前
基于Cloudflare生态的应用部署与开发全解
人工智能·agent·cloudflare
俞凡15 小时前
DevOps 2.0:智能体如何接管故障修复和基础设施维护
人工智能
comedate15 小时前
[OpenClaw] GLM 5 关于电影 - 人工智能 - 的思考
人工智能·电影评价
财迅通Ai15 小时前
6000万吨产能承压 卫星化学迎来战略窗口期
大数据·人工智能·物联网·卫星化学
liliangcsdn15 小时前
Agent Memory智能体记忆系统的示例分析
数据库·人工智能·全文检索