PaddleX本地安装教程

PaddleX 3.0 是基于飞桨框架构建的低代码开发工具,它集成了众多开箱即用的预训练模型 ,可以实现模型从训练到推理的全流程开发 ,支持国内外多款主流硬件 ,助力AI 开发者进行产业实践。

下面主要是官方文档,源地址**:PaddleX 文档**

一、安装飞桨 PaddlePaddle

官方文档:开始使用_飞桨-源于产业实践的开源深度学习平台

PaddlePaddle3.3安装,cuda12.6

python 复制代码
 python -m pip install paddlepaddle-gpu==3.3.0 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/

二、PaddleX安装

注意:

在安装 PaddleX 之前,请确保您已具备基本的 Python 运行环境 (注:目前支持 Python 3.8 至 Python 3.12 )。PaddleX 3.0-rc1 版本依赖的 PaddlePaddle 版本为 3.0.0以上版本

2.1 插件安装模式

若您使用PaddleX的应用场景为二次开发 (例如重新训练模型、微调模型、自定义模型结构、自定义推理代码等),那么推荐您使用功能更加强大的插件安装模式。

安装您需要的PaddleX插件之后,您不仅同样能够对插件支持的模型进行推理与集成,还可以对其进行模型训练等二次开发更高级的操作。

PaddleX支持的模型训练相关插件如下,请您根据开发需求,确定所需的一个或多个插件名称:

👉 插件和产线对应关系(点击展开)

模型产线 模块 对应插件
通用图像分类 图像分类 PaddleClas
通用目标检测 目标检测 PaddleDetection
通用语义分割 语义分割 PaddleSeg
通用实例分割 实例分割 PaddleDetection
通用OCR 文档图像方向分类 文本图像矫正 文本检测 文本行方向分类 文本识别 PaddleOCR PaddleClas
通用表格识别 版面区域检测 表格结构识别 文本检测 文本识别 PaddleOCR PaddleDetection
文档场景信息抽取v3 表格结构识别 版面区域检测 文本检测 文本识别 印章文本检测 文本图像矫正 文档图像方向分类 PaddleOCR PaddleDetection PaddleClas
时序预测 时序预测模块 PaddleTS
时序异常检测 时序异常检测模块 PaddleTS
时序分类 时序分类模块 PaddleTS
通用多标签分类 图像多标签分类 PaddleClas
小目标检测 小目标检测 PaddleDetection
图像异常检测 无监督异常检测 PaddleSeg

若您需要安装的插件为PaddleXXX,可以直接执行如下指令快速安装PaddleX的对应插件:

bash 复制代码
git clone https://github.com/PaddlePaddle/PaddleX.git 
cd PaddleX 
pip install -e . 
paddlex --install PaddleXXX

❗ 注:采用这种安装方式后,是可编辑模式安装,当前项目的代码更改,都会直接作用到已经安装的 PaddleX Wheel 包。

如果上述安装方式可以安装成功,则可以跳过接下来的步骤。

若您使用Linux操作系统,请参考2. Linux安装PaddleX详细教程。其他操作系统的安装方式,敬请期待。

2.2 自定义方式安装PaddleX

2.2.1 获取 PaddleX 源码

接下来,请使用以下命令从 GitHub 获取 PaddleX 最新源码:

bash 复制代码
git clone https://github.com/PaddlePaddle/PaddleX.git

如果访问 GitHub 网速较慢,可以从 Gitee 下载,命令如下:

bash 复制代码
git clone https://gitee.com/paddlepaddle/PaddleX.git

2.2.2 安装PaddleX

获取 PaddleX 最新源码之后,您可以选择Wheel包安装模式或插件安装模式。

若您选择Wheel包安装模式,请执行以下命令:

bash 复制代码
cd PaddleX

# 安装 PaddleX whl
# -e:以可编辑模式安装,当前项目的代码更改,都会直接作用到已经安装的 PaddleX Wheel
pip install -e ".[base]"

若您选择插件安装模式,并且您需要的插件名称为 PaddleXXX(可以有多个),请执行以下命令:

bash 复制代码
cd PaddleX

# 安装 PaddleX whl
# -e:以可编辑模式安装,当前项目的代码更改,都会直接作用到已经安装的 PaddleX Wheel
pip install -e ".[base]"

# 安装 PaddleX 插件
paddlex --install PaddleXXX

例如,您需要安装PaddleOCR、PaddleClas插件,则需要执行如下命令安装插件:

bash 复制代码
# 安装 PaddleOCR、PaddleClas 插件
paddlex --install PaddleOCR PaddleClas

若您需要安装全部插件,则无需填写具体插件名称,只需执行如下命令:

bash 复制代码
# 安装 PaddleX 全部插件
paddlex --install

插件的默认克隆源为 github.com,同时也支持 gitee.com 克隆源,您可以通过--platform 指定克隆源。

例如,您需要使用 gitee.com 克隆源安装全部PaddleX插件,只需执行如下命令:

bash 复制代码
# 安装 PaddleX 插件
paddlex --install --platform gitee.com

安装完成后,将会有如下提示:

bash 复制代码
All packages are installed.

更多硬件环境的PaddleX安装请参考PaddleX多硬件使用指南

2.3 选择性安装依赖

PaddleX 的功能丰富,而不同的功能需要的依赖也不尽相同。将 PaddleX 中不需要安装插件即可使用的功能归类为"基础功能"。PaddleX 官方 Docker 镜像预置了基础功能所需的全部依赖;使用上文介绍的 pip install "...[base]" 的安装方式也将安装基础功能需要的所有依赖。如果您只专注于 PaddleX 的某一项功能,且希望保持安装的依赖的体积尽可能小,可以通过指定"依赖组"的方式,选择性地安装依赖:

bash 复制代码
# 以仅安装 OCR 类基础功能为例

# 安装预编译的 wheel 包
pip install "paddlex[ocr]"
# 从源码安装
pip install -e ".[ocr]"

# 也可以同时指定多个依赖组
pip install -e ".[ocr,cv]"

PaddleX 目前提供如下依赖组:

依赖组名称 对应的功能
base PaddleX 的所有基础功能。
cv CV 产线的基础功能。
multimodal 多模态产线的基础功能。
ie 信息抽取产线的基础功能。
ocr OCR 类产线的基础功能。
speech 语音产线的基础功能。
ts 时序产线的基础功能。
video 视频产线的基础功能。
trans 翻译产线的基础功能。
genai-client 生成式 AI 客户端功能。安装此依赖组等效于安装 PaddleX 生成式 AI 客户端插件;也可以通过 PaddleX CLI 安装生成式 AI 客户端插件。
genai-sglang-server SGLang 服务器功能。安装此依赖组等效于安装 PaddleX SGLang 服务器插件;也可以通过 PaddleX CLI 安装SGLang 服务器插件。
genai-vllm-server vLLM 服务器功能。安装此依赖组等效于安装 PaddleX vLLM 服务器插件;也可以通过 PaddleX CLI 安装 vLLM 服务器插件。
serving 服务化部署功能。安装此依赖组等效于安装 PaddleX 服务化部署插件;也可以通过 PaddleX CLI 安装服务化部署插件。
paddle2onnx Paddle2ONNX 功能。安装此依赖组等效于安装 PaddleX Paddle2ONNX 插件;也可以通过 PaddleX CLI 安装 Paddle2ONNX 插件。

每一条产线属于且仅属于一个依赖组;在各产线的使用文档中可以了解产线属于哪一依赖组。对于单功能模块,安装任意包含该模块的产线对应的依赖组后即可使用相关的基础功能。

2.4 PaddleX 对飞桨框架的依赖

PaddleX 的绝大部分功能依赖飞桨框架,因此,在大多数情况下,您需要在使用 PaddleX 前参考 飞桨PaddlePaddle本地安装教程 安装飞桨框架。不过,对于以下几种情形,不必安装飞桨框架也可以使用相应的功能:

  • 使用 PaddleX genai-vllm-servergenai-sglang-server 插件提供的能力部署模型推理服务。
  • 使用 PaddleX genai-client 插件调用生成式 AI 推理服务。
相关推荐
Tassel_YUE21 小时前
超节点文章 4:MoE、长上下文与智能体:哪些 AI 负载最需要超节点?
人工智能·数据中心·超节点
Bacon21 小时前
RAG 从入门到入土:Agent 时代,你的检索增强生成到底行不行?
前端·人工智能
DogDaoDao21 小时前
视频直播技术全栈深入解析:从入门到精通
人工智能·音视频·实时音视频·视频编解码·视频直播
薛定猫AI21 小时前
【深度解析】Hermes Agent 0.14:OpenAI 兼容本地代理、按需依赖加载与 AI Coding 工作流升级
人工智能
汐ya~21 小时前
Chrome DevTools MCP:把浏览器自动化与 DevTools 调试能力接入 AI Agent
人工智能·自动化·agent·chrome devtools
小羊Yveesss21 小时前
AI智能单元测试:覆盖率泡沫与可信测试的产业破局
人工智能·单元测试
EnCi Zheng21 小时前
09-斯坦福CS336作业 [特殊字符]
人工智能·pytorch·python·深度学习·神经网络
ZPC821021 小时前
Open3D 与yolo-3d 那个更适合生成物体3d 包围盒
人工智能·算法·计算机视觉·机器人
码农小白AI21 小时前
IACheck AI报告审核:五金螺丝牙纹检测报告,标准合规不用再靠人工硬扛!
人工智能
Hali_Botebie1 天前
【量化】Post-training quantization for vision transformer.
人工智能·深度学习·transformer