针对PaddleOCR 3.4.0 版本在Windows上从源码安装,核心变化在于其安装机制和依赖项与之前的版本(如2.x)有较大不同。
根据最新的官方文档,PaddleOCR 3.x 系列(包括3.4.0)的安装和依赖管理方式已经更新 。下面是根据你的要求整理的安装步骤。
📋 第一步:准备Python环境
PaddleOCR 3.4.0 对Python版本有明确要求,请确保你的环境符合条件。
-
Python版本要求:3.8、3.9、3.10、3.11 或 3.12 。
-
(强烈推荐)使用虚拟环境 :用Anaconda创建一个干净的环境,避免与其他项目产生依赖冲突。
bash# 创建名为paddleocr340_env,Python版本为3.10的环境 conda create -n paddleocr340_env python=3.10 # 激活环境 conda activate paddleocr340_env
🚀 第二步:安装核心引擎(飞桨 PaddlePaddle)
PaddleOCR 3.4.0 要求 PaddlePaddle版本必须大于或等于 3.0.0 。请根据你的硬件情况,在激活的环境中选择安装。
-
CPU版本 (兼容性最好):
bashpip install paddlepaddle -i https://mirror.baidu.com/pypi/simple -
GPU版本 (需要NVIDIA显卡,速度更快):
bash# 请根据你的CUDA版本选择合适的安装命令。以下以CUDA 11.8为例,更多版本请参考官方文档 pip install paddlepaddle-gpu==3.4.0 -f https://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html如果不确定CUDA版本,可以在命令行输入
nvidia-smi查看。
安装后,运行以下Python代码进行验证:
python
import paddle
print(paddle.__version__) # 预期输出应为 3.x.x
paddle.utils.run_check()
📥 第三步:从源码安装PaddleOCR 3.4.0
从3.x版本开始,PaddleOCR的安装方式更加模块化,它依赖PaddleX作为推理基础设施 。从源码安装可以让你获取最新的代码和特性。
-
克隆指定版本的PaddleOCR仓库 :
在你想要存放项目的目录下,打开命令行,执行以下命令来克隆 3.4.0 版本的代码。首先,克隆完整仓库,然后切换到对应的tag。
bash# 克隆主仓库 git clone https://github.com/PaddlePaddle/PaddleOCR.git # 如果上面clone不下来可以使用国内源直接下载源码: kaggle.com/futureflsl/paddleocr-src # 进入目录 cd PaddleOCR # 切换到3.4.0版本的代码 git checkout v3.4.0 -
安装核心OCR功能 :
PaddleOCR 3.4.0的核心功能现在通过PaddleX包提供。最基本的核心OCR安装命令如下,它会自动安装必要的依赖 。
bashpip install -e . -i https://mirror.baidu.com/pypi/simple或者,如果你想明确安装核心OCR依赖,可以执行:
bashpip install "paddlex[ocr-core]>=3.4.0,<3.5.0" -i https://mirror.baidu.com/pypi/simple -
(可选)安装更多功能模块 :
如果你需要使用文档解析(如表格、公式识别)、信息提取(PP-ChatOCR)或翻译等功能,可以按需安装额外的依赖组 。
-
文档解析功能 (Layout detection, Table recognition, etc.):
bashpip install "paddlex[ocr,genai-client]>=3.4.0,<3.5.0" -i https://mirror.baidu.com/pypi/simple -
信息提取功能 (PP-ChatOCRv4):
bashpip install "paddlex[ie]>=3.4.0,<3.5.0" -i https://mirror.baidu.com/pypi/simple -
文档翻译功能 :
bashpip install "paddlex[trans]>=3.4.0,<3.5.0" -i https://mirror.baidu.com/pypi/simple -
所有功能全安装 :
bashpip install "paddlex[ocr,genai-client,ie,trans]>=3.4.0,<3.5.0" -i https://mirror.baidu.com/pypi/simple
-
-
(重要)安装训练所需的依赖 :
如果你需要进行模型训练,仅仅安装核心包是不够的,还需要安装源码中的
requirements.txt。bashpip install -r requirements.txt -i https://mirror.baidu.com/pypi/simple这个文件包含了像
shapely,scikit-image,opencv-python等重要的依赖库 。在Windows上安装shapely时如果遇到问题,可以尝试手动下载与你Python版本对应的whl文件进行安装。
🎯 第四步:验证安装
安装完成后,通过一个简单的Python脚本来验证PaddleOCR 3.4.0是否工作正常。首次运行时会自动下载模型,请保持网络畅通。
创建一个.py文件,例如test_ocr_340.py,写入以下代码:
python
from paddleocr import PaddleOCR
# 初始化OCR,首次运行会自动下载模型
# 你可以通过环境变量 PADDLE_PDX_MODEL_SOURCE 切换下载源(如 'BOS' 使用百度源)
ocr = PaddleOCR(use_angle_cls=True, lang='ch', use_gpu=False) # 如果没有GPU,设置use_gpu=False
# 指定图片路径,可以使用源码目录下的测试图片
img_path = 'doc/imgs/11.jpg'
# 执行OCR
result = ocr.ocr(img_path, cls=True)
# 打印识别结果
if result and result[0] is not None:
for line in result[0]:
print(f'识别文本: {line[1][0]}, 置信度: {line[1][1]}')
else:
print("未识别到文字")
在命令行中运行:
bash
python test_ocr_340.py
如果看到识别的文字信息,恭喜你,PaddleOCR 3.4.0在Windows上的源码安装就成功了。
💡 常见问题与贴士
-
模型下载失败 :如果从默认的HuggingFace源下载模型失败,可以通过设置环境变量切换到国内的百度对象存储(BOS)源 :
pythonimport os os.environ['PADDLE_PDX_MODEL_SOURCE'] = 'BOS' # 然后再初始化 PaddleOCR -
PaddlePaddle版本不匹配 :如果遇到
ImportError: PaddleOCR requires PaddlePaddle >= 3.0.0的错误,请升级你的PaddlePaddle版本 。 -
缺少依赖模块 :当使用某些特定功能(如文档解析)时,如果遇到
ModuleNotFoundError,请检查是否安装了对应的可选依赖组(如paddlex[ocr,genai-client])。
如果你在安装过程中遇到任何具体的报错信息,可以随时告诉我,我会尽力协助你解决。在这里插入代码片