Windows系统上离线部署Python运行飞桨(PaddlePaddle) OCR服务

1. 离线准备Python环境

1.1 在联网机器下载所需组件
bash 复制代码
# 创建项目目录
mkdir paddle_ocr_offline
cd paddle_ocr_offline

# 下载Python安装包 (以Python 3.8为例)
pip download python==3.8.10 --platform win_amd64 --only-binary=:all:

# 下载PaddlePaddle和OCR库
pip download paddlepaddle==2.4.2 paddleocr==2.7.0.3 -f https://www.paddlepaddle.org.cn/whl/windows.html

# 下载依赖库 (实际依赖以pip show paddlepaddle为准)
pip download numpy opencv-python shapely scikit-image pyclipper lmdb tqdm
1.2 打包依赖

将下载的 .whl 文件和 Python 安装包复制到离线机器。


2. 离线安装Python环境

2.1 安装Python

运行 Python 安装包(如 python-3.8.10-amd64.exe),勾选 Add to PATH

2.2 安装依赖库
cmd 复制代码
:: 进入依赖目录
cd /d D:\paddle_ocr_offline

:: 安装所有依赖
pip install --no-index --find-links=. paddlepaddle-2.4.2-cp38-cp38-win_amd64.whl
pip install --no-index --find-links=. paddleocr-2.7.0.3-py3-none-any.whl
pip install --no-index --find-links=. numpy opencv_python shapely scikit_image pyclipper lmdb tqdm

3. 部署飞桨OCR服务

创建Python脚本 ocr_service.py

python 复制代码
from paddleocr import PaddleOCR
from flask import Flask, request, jsonify
# 初始化OCR模型,启用空格识别
ocr = PaddleOCR(
    use_angle_cls=True,
    lang='ch',# 语言
    use_gpu=False,
    use_space_char=True,  # 关键:启用空格识别
    det_model_dir='C:/Users/Administrator/.paddleocr/whl/det/ch/ch_ppocr_server_v2.0_det_infer',
    rec_model_dir='C:/Users/Administrator/.paddleocr/whl/rec/ch/ch_ppocr_server_v2.0_rec_infer',
    cls_model_dir='C:/Users/Administrator/.paddleocr/whl/cls/ch_ppocr_mobile_v2.0_cls_infer'
)
app = Flask(__name__)
@app.route('/ocr', methods=['POST'])
def handle_ocr():
    image = request.files['image'].read()
    result = ocr.ocr(image, cls=True)
    return jsonify(result)

if __name__ == '__main__':
    app.run(host='0.0.0.0', port=5000)
模型离线准备(关键!)
  • PaddleOCR官方GitHub下载模型文件:

    • ch_ppocr_server_v2.0_det_infer.tar (文本检测)
    • ch_ppocr_server_v2.0_rec_infer.tar (文本识别)
    • ch_ppocr_mobile_v2.0_cls_infer.tar (方向分类)
  • 解压到离线机器目录:

    复制代码
    C:\Users\<用户名>\.paddleocr\whl\

5. 离线部署注意事项

  1. 模型文件

    必须提前下载模型并放置到 C:\Users\<用户名>\.paddleocr\whl\ 目录,否则首次运行会尝试联网下载。

  2. 环境一致性

    • Python版本需一致(推荐3.7/3.8)
    • 所有.whl文件必须与操作系统架构匹配(Windows 64位)
  3. 路径处理

    • Java调用时使用绝对路径
    • 路径中避免空格和特殊字符
  4. 错误排查

    • 在命令行测试Python脚本:

      bash 复制代码
      python ocr_service.py D:\test.png
    • 检查Java进程的输入流和错误流


相关推荐
财经资讯数据_灵砚智能3 分钟前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年4月12日
人工智能·python·信息可视化·自然语言处理·ai编程
测试秃头怪21 分钟前
python&selenium自动化测试实战项目详解
自动化测试·软件测试·python·selenium·测试工具·职场和发展·测试用例
航Hang*22 分钟前
Windows Server 配置与管理——第10章:配置FTP服务器
运维·服务器·网络·windows·学习·vmware
踏着七彩祥云的小丑27 分钟前
Python——字符串常用操作
开发语言·python
灵犀海棠28 分钟前
电脑运行程序配置
windows
阿钱真强道30 分钟前
05 ComfyUI + SVD 系列(三):最小图生视频工作流拆解——节点含义、输入输出、参数作用与核心实验
python·aigc·stable-diffusion·svd·comfyui·工作流·图生视频
xcjbqd032 分钟前
Python中Pandas如何将DataFrame写入MySQL_使用to_sql函数
jvm·数据库·python
蓝色的杯子34 分钟前
Python面试30分钟突击掌握-LeetCode3-Linked list
python·leetcode·面试
ZC跨境爬虫44 分钟前
海南大学交友平台开发实战 day10(后端向前端输出_前端读取数据全流程联调+日志调试落地)
前端·python·sqlite·html·状态模式
航Hang*1 小时前
Windows Server 配置与管理——第9章:配置DHCP服务器
运维·服务器·windows·学习