poppler_path 是用于 Python 库如 pdf2image 进行 PDF 转换时

poppler_path 是用于 Python 库如 pdf2image 进行 PDF 转换时指定 Poppler 可执行文件路径的参数。为了让程序正常工作,需要先安装 Poppler,并配置环境变量或在代码中设置 poppler_path。

以下是 Poppler 的安装与环境变量配置方法,按操作系统分别说明:

💻 Windows 系统

  1. 下载 Poppler

* 访问 Poppler for Windows(http://blog.alivate.com.au/popplerwindows/)

* 下载 popplerxx_xx_xx.zip(推荐 "latest binary")

* 解压缩到一个文件夹,例如:C:\poppler

  1. 配置环境变量

  2. 复制解压后的路径,比如:

C:\poppler\Library\bin

  1. 打开【控制面板】→【系统】→【高级系统设置】→【环境变量】

  2. 找到系统变量中的 Path,点击【编辑】,添加上述路径

  3. 确认保存后,打开命令行输入:

where pdfinfo

如果返回了 pdfinfo.exe 的路径,说明配置成功。

  1. Python 中使用(如果不配置环境变量)

python

from pdf2image import convert_from_path

images = convert_from_path("example.pdf", poppler_path=r"C:\poppler\Library\bin")

🐧 Linux 系统(如 Ubuntu)

Poppler 通常可以直接通过包管理器安装:

bash

sudo apt update

sudo apt install popplerutils

安装后,Poppler 的工具如 pdftoppm 和 pdfinfo 默认已在系统路径中,无需设置 poppler_path。

🍎 macOS 系统

通过 Homebrew 安装:

bash

brew install poppler

同样,Poppler 工具会自动加入 PATH,Python 中无需设置 poppler_path。

相关推荐
早起CaiCai14 分钟前
【Pytorch 实践1】手写数字
人工智能·pytorch·python
吴梓穆26 分钟前
Python 语法基础 函数
开发语言·python
Kobebryant-Manba33 分钟前
学习文本处理
开发语言·python
m0_6174939438 分钟前
PaddleOCR报错:OneDnnContext does not have the input Filter 解决方案汇总
python
李可以量化41 分钟前
量化迅投 QMT vs 聚宽 (JoinQuant)全面分析
python·量化·qmt·ptrade·聚宽
旅僧1 小时前
运行UMI镜像
python
ellenwan20261 小时前
期货跨期价差程序化怎么做:天勤 SP 合约与腿比例核对
python·区块链
月疯1 小时前
torch:expand和repeate的区别
开发语言·python·深度学习
顾林海1 小时前
Agent入门阶段-编程基础-Python:Python 开发环境与运行方式
python·agent·ai编程
叫我:松哥1 小时前
基于深度卷积神经网络的水果图片分类算法设计与实现,有ResNet50的迁移学习模型,准确率达95%
人工智能·python·神经网络·机器学习·分类·cnn·迁移学习