Paddle Serving|部署一个自己的OCR识别服务器

前言

之前使用C++部署了自己的OCR识别服务器,Socket网络传输部分是自己写的,回过头来一看,自己犯傻了,PaddleOCR本来就有自己的OCR服务器项目,叫PaddleServing,这里记录一下部署过程。

1 下载依赖环境

1.1 下载python

官网要求是python3.6之上就行,我这里下载python3.8。

bash 复制代码
conda create -n pdsrv python=3.8

注:这里用不用conda都可以,我这里是习惯用conda,只要有python环境就行.

下载完成之后,加到环境变量里面去,并且优先级设置成最高:

1.2 下载wget和git(可选)

下载解压(安装)完成后,同样将其添加到系统变量中,如步骤1.1的图最后一行所示,我已经添加上去了,优先级无所谓。
wget验证: 打开powershell直接打wget,访问成功即可,如图所示:

  • git下载网址为:git下载
    git的使用就不赘述,有手就行。

如果选择了步骤1.2,下载git和wget,则需要下载模型和项目,使用以下命令下载:

bash 复制代码
# 使用git下载PaddleServing项目
git clone https://github.com/paddlepaddle/Serving
# 使用wget下载模型
cd Serving/examples/C++/PaddleOCR/ocr/
python -m paddle_serving_app.package --get_model ocr_rec
tar -xzvf ocr_rec.tar.gz
python -m paddle_serving_app.package --get_model ocr_det
tar -xzvf ocr_det.tar.gz

1.3 下载PaddleServing依赖

bash 复制代码
# CPU用户下载命令
python -m pip install -U paddle_serving_server paddle_serving_client paddle_serving_app paddlepaddle`
# GPU用户下载命令
python -m pip install -U paddle_serving_server_gpu paddle_serving_client paddle_serving_app paddlepaddle-gpu
# 下载其依赖
cd Serving
pip install -r python/requirements_win.txt

之所以说步骤1.2是可选,是因为我上传了源码(需要使用git下载的部分)和模型(需要使用wget下载的部分),惊不惊喜,意不意外!!!

2 运行OCR识别服务器

2.1 启动OCR识别服务器:

bash 复制代码
# 启动服务器
python ocr_debugger_server.py cpu/gpu

启动界面大概是这样的:

2.2 启动OCR客户端:

bash 复制代码
python ocr_web_client.py

可以看到结果与imgs路径下的图片对比:


如果不想使用这个脚本,也可以使用我写的python脚本测试:

python 复制代码
import requests
import json
import base64

def cv2_to_base64(image):
    """将图片转换为Base64编码"""
    return base64.b64encode(image).decode('utf8')


def ocr_prediction(image_path):
    """接受图片文件的绝对路径,发送OCR请求并返回结果"""
    # 设置请求头和URL
    headers = {"Content-type": "application/json"}
    url = "http://127.0.0.1:9292/ocr/prediction"

    # 打开图片文件并进行Base64编码
    with open(image_path, 'rb') as file:
        image_data = file.read()
    image_base64 = cv2_to_base64(image_data)

    # 构造请求数据
    data = {"feed": [{"x": image_base64}], "fetch": ["res"]}

    print(type(data))
    data2 = json.dumps(data)
    print(type(data2))
    print(data2)
    # 发送POST请求
    try:
        r = requests.post(url=url, headers=headers, data=data2)
        r.raise_for_status()  # 如果请求失败,抛出异常
        return r.json()  # 返回OCR结果
    except requests.exceptions.RequestException as e:
        print(f"请求失败: {e}")
        return None


# 这里替换为你的图片文件绝对路径
image_path = "xxx/imgs/bbb.jpg"  
result = ocr_prediction(image_path)
if result:
    print(result)

总结

本文主要简要记录了PaddleServing项目的部署过程,旨在帮助读者快速了解如何搭建和配置PaddleServing服务。PaddleServing是一个基于PaddlePaddle的高效推理服务框架,能够帮助用户便捷地将训练好的模型部署为可供实时预测的服务。本文将详细介绍部署过程的步骤,包括环境配置、服务启动、模型加载以及API调用等方面的内容。

相关推荐
PythonFun22 分钟前
OCR图片识别翻译工具功能及源码
python·ocr·机器翻译
用什么都重名22 分钟前
DeepSeek-OCR 深度解析
人工智能·ocr·deepseek-ocr
lvnacp23 分钟前
Qwen3-VL微调自定义OCR任务
ocr
奋斗的蛋黄1 小时前
网络卡顿运维排查方案:从客户端到服务器的全链路处理
运维·服务器·网络
wanhengidc2 小时前
云手机搬砖 尤弥尔传奇自动化操作
运维·服务器·arm开发·安全·智能手机·自动化
图图图图爱睡觉2 小时前
主机跟虚拟机ip一直Ping不通,并且虚拟机使用ifconfig命令时,ens33没有ipv4地址,只有ipv6地址
服务器·网络·tcp/ip
deephub2 小时前
FastMCP 入门:用 Python 快速搭建 MCP 服务器接入 LLM
服务器·人工智能·python·大语言模型·mcp
lhxcc_fly3 小时前
Linux网络--8、NAT,代理,网络穿透
linux·服务器·网络·nat
wow_DG3 小时前
【运维✨】云服务器公网 IP 迷雾:为什么本机看不到那个地址?
运维·服务器·tcp/ip
一个处女座的暖男程序猿4 小时前
2G2核服务器安装ES
服务器·elasticsearch·jenkins