Docker安装PaddleOCR并提供接口服务(CPU)

#初始化复制配置#创建数据目录

复制代码
sudo mkdir -p /app/paddle
sudo chmod -R 777 /app/paddle

#生成dockerfile

复制代码
sudo cat > /app/paddle/dockerfile <<EOF
FROM python:3.9-slim

# 设置环境变量:限制线程数,避免线程冲突导致 Paddle 崩溃
ENV OMP_NUM_THREADS=1
ENV MKL_NUM_THREADS=1
ENV FLAGS_allocator_strategy=naive_best_fit

# 安装 PaddleOCR 和 OpenCV 所需的系统库
RUN apt-get update && apt-get install -y \
    libgl1 \
    libglib2.0-0 \
    libgomp1 \
    && rm -rf /var/lib/apt/lists/*

# 安装 Python 依赖(OCR 和 Flask Web 服务)
RUN pip install --no-cache-dir \
    paddleocr \
    flask \
    paddlepaddle -f https://paddlepaddle.org.cn/whl/cpu.html

# ✅ 可选:提前拉模型用于缓存,也可删除这行以加快构建速度
RUN python -c "from paddleocr import PaddleOCR; PaddleOCR(use_angle_cls=False, lang='en')"

# 拷贝应用
COPY app.py /app.py

# 启动 Flask 服务
CMD ["python", "/app.py"]

EOF

#生成app.py(示例用于提取英语单词)

复制代码
sudo cat > /app/paddle/app.py <<EOF
from flask import Flask, request, jsonify
import requests, io, re
import numpy as np
from PIL import Image
import threading
from concurrent.futures import ThreadPoolExecutor
from paddleocr import PaddleOCR

app = Flask(__name__)
executor = ThreadPoolExecutor(max_workers=2)
thread_local = threading.local()

def get_ocr():
    if not hasattr(thread_local, "ocr"):
        thread_local.ocr = PaddleOCR(
            use_textline_orientation=False,
            lang='en'
        )
    return thread_local.ocr

def process_image(bytes_data):
    try:
        img = Image.open(io.BytesIO(bytes_data)).convert("RGB")
        img_np = np.array(img)
        ocr = get_ocr()
        result = ocr.ocr(img_np)
        texts = result[0].get('rec_texts', [])
        words = [m.group(1) for t in texts if (m := re.match(r'^[0-9]*([A-Za-z]+)$', t))]
        return {"words": words}
    except Exception as e:
        return {"error": str(e)}

@app.route('/ocr', methods=['POST'])
def ocr_route():
    data = request.get_json()
    if not data or 'image_url' not in data:
        return jsonify({"error": "Missing 'image_url'"}), 400
    try:
        resp = requests.get(data['image_url']); resp.raise_for_status()
    except Exception as e:
        return jsonify({"error": f"Failed download image: {e}"}), 400

    future = executor.submit(process_image, resp.content)
    result = future.result()
    if "error" in result:
        return jsonify({"error": "OCR failed: " + result["error"]}), 500
    return jsonify(result)

if __name__ == "__main__":
    app.run(host="0.0.0.0", port=8866)

EOF

#创建docker镜像

复制代码
cd /app/paddle

docker build -t paddleocr-flask-en .

#启动docker容器

复制代码
docker run -p 8866:8866 -d -v /app/paddle/paddle_data:/root/.paddlex --rm --name paddleocr paddleocr-flask-en

#请求示例

复制代码
curl -X POST http://your.domain:8866/ocr -H "Content-Type: application/json" -d '{"image_url": "http://your.image.domain/demo.jpg"}'
相关推荐
Irene19912 小时前
Win11 自动更新导致 Docker Desktop 无法正常启动,Oracle SQL Developer 启动时报错
docker·更新
天天进步20154 小时前
Python全栈项目--Python自动化运维工具开发
运维·python·自动化
Soari4 小时前
Ubuntu 根分区文件系统损坏,系统启动时自动检查失败
linux·运维·ubuntu
杨云龙UP4 小时前
Oracle Health Check巡检脚本使用SOP V2.0:从HTML原始报告→生成Word专业巡检报告→交付客户_2026-06-03
linux·运维·数据库·sql·oracle·报告·巡检
广州灵眸科技有限公司4 小时前
瑞芯微RV1126B开发板(EASY-EAI-PI2) Linux虚拟机准备
linux·运维·服务器
darkdragonking4 小时前
OpenEuler 22.03 ,以docker ce 安装 Milvus 及可视化工具
docker·容器·milvus
Lana学习中5 小时前
【运维杂记】连接不上远程服务器的问题处理
运维·服务器
AOwhisky6 小时前
MySQL 学习笔记(第一期):数据库基础与 MySQL 初探
运维·数据库·笔记·学习·mysql·云计算
Peace6 小时前
【Prometheus】
linux·运维·prometheus
我叫张土豆6 小时前
V100 显卡部署 Qwen3-ASR-1.7B 语音识别模型(vLLM + Docker 完整教程)
docker·语音识别·vllm