记录paddlepaddleOCR从环境到使用默认模型,再训练自己的数据微调模型再推理

启动paddlelabel:

python 复制代码
(ppocrlabelpy310) C:\develop\PythonEnvs\anaconda3\envs\ppocrlabelpy310>PPOCRLabel --lang ch > error.log 2>&1

会等几分钟才能启动,我的挺慢的

标注好之后,点导出标记结果和导出识别结果

开始划分数据集:

直接执行也可:

python 复制代码
python gen_ocr_train_val_test.py --trainValTestRatio 6:2:2 --datasetRootPath ./train_data/

训练脚本:

python 复制代码
python tools/train.py -c pretrain_models/PP-OCRv5_server_rec.yml -o Global.pretrained_model=pretrain_models/PP-OCRv5_server_rec_pretrained.pdparams Global.print_batch_step=1

导出识别模型:

python 复制代码
python tools/export_model.py -c pretrain_models/PP-OCRv5_server_rec.yml -o Global.pretrained_model=D:\Projects_Datas\HIMA15\ppocrpro\PaddleOCR\output\PP-OCRv5_server_rec\best_model\model.pdparams Global.save_inference_dir="./inference_model/rec/"
相关推荐
程序猿乐锅几秒前
什么是skills? 如何使用skills?如何创建skills?
人工智能·skills
nebula-AI几秒前
人工智能导论:模型与算法(未来发展与趋势)
人工智能·神经网络·算法·机器学习·量子计算·automl·类脑计算
动物园猫1 分钟前
桥梁损伤目标检测数据集分享(适用于YOLO系列深度学习分类检测任务)
深度学习·yolo·目标检测
灵机一物3 分钟前
灵机一物AI原生电商小程序、PC端(已上线)-OpenAI 模型推翻离散几何核心猜想:AI 首次证明人类错了
人工智能
Tony Bai3 分钟前
AI 编码胜率榜:Go 与 Rust 完胜 C++
人工智能
数字时代全景窗4 分钟前
从OpenClaw、Palantir、SpaceX,看颠覆式创新的四个层次(5)传统财务模型的局限
大数据·人工智能·架构·软件工程
code_pgf4 分钟前
sVLM在资源受限环境中的应用案例
人工智能·深度学习·架构
灰灰勇闯IT5 分钟前
ops-math 的 ReduceSum:Tensor 归约为什么是计算热点
深度学习
多年小白5 分钟前
复盘】2026年5月21日(周四)
大数据·人工智能·ai·金融·区块链
南屹川5 分钟前
【并发编程】Python异步编程实战:从协程到异步框架
人工智能