利用python 检测当前目录下的所有PDF 并转化为png 格式

以下是一个完整的 Python 脚本,用于检测当前目录下的所有 PDF 文件并将每一页转换为 PNG 格式:

python 复制代码
import os
from pdf2image import convert_from_path

# 设置输出图像的 DPI(分辨率)
DPI = 300

# 获取当前目录
current_directory = os.getcwd()

# 获取所有 PDF 文件
pdf_files = [file for file in os.listdir(current_directory) if file.endswith('.pdf')]

# 检查是否有 PDF 文件
if not pdf_files:
    print("当前目录没有找到任何 PDF 文件。")
else:
    # 创建保存 PNG 文件的文件夹
    output_directory = os.path.join(current_directory, "pdf_to_png_output")
    os.makedirs(output_directory, exist_ok=True)
    
    for pdf_file in pdf_files:
        pdf_path = os.path.join(current_directory, pdf_file)
        print(f"正在处理: {pdf_file}")
        
        # 转换 PDF 为图像
        try:
            images = convert_from_path(pdf_path, dpi=DPI)
            for i, image in enumerate(images):
                output_file = os.path.join(output_directory, f"{os.path.splitext(pdf_file)[0]}_page_{i+1}.png")
                image.save(output_file, "PNG")
                print(f"已保存: {output_file}")
        except Exception as e:
            print(f"处理文件 {pdf_file} 时出错: {e}")

print("转换完成。")

使用说明

  1. 安装依赖:

    请确保安装了 pdf2imagepopplerpdf2image 需要依赖 poppler-utils)。

    bash 复制代码
    conda install pdf2image

    对于 poppler,可以根据你的操作系统安装:

    • Windows:下载 Poppler 的二进制文件并将其添加到系统 PATH。
    • macOS :通过 brew install poppler 安装。
    • Linux :通过 apt install poppler-utils 安装。
  2. 运行脚本:

    将脚本保存为 convert_pdf_to_png.py,然后在包含 PDF 文件的目录下运行:

    bash 复制代码
    python convert_pdf_to_png.py
  3. 结果保存:

    所有生成的 PNG 文件将保存到当前目录下的 pdf_to_png_output 文件夹中。

如果需要修改 DPI(影响图像质量),可以调整脚本中的 DPI 变量值。

相关推荐
计算机徐师兄18 小时前
Python基于Django的创新实验室系统(附源码,文档说明)
python·django·创新实验室系统·python创新实验室系统·创新实验室·实验室系统·python实验室系统
sinat_3834373618 小时前
HTML函数调试需要高性能电脑吗_调试环境硬件需求技巧【指南】
jvm·数据库·python
解救女汉子18 小时前
Nginx如何配置phpMyAdmin访问_反向代理设置方法
jvm·数据库·python
格鸰爱童话18 小时前
python使用milvus向量库
python·milvus
qq_2069013918 小时前
Navicat导出CSV文件数据为空如何解决_过滤条件与权限排查
jvm·数据库·python
m0_5887584818 小时前
高效实现分组内跨行时间戳匹配:为每组生成布尔标记列 user_rejects
jvm·数据库·python
好运的阿财19 小时前
OpenClaw工具拆解之 web_fetch+image_generate
前端·python·机器学习·ai·ai编程·openclaw·openclaw工具
qq_2069013919 小时前
golang如何实现日志按级别过滤_golang日志按级别过滤实现教程.txt
jvm·数据库·python
无风听海19 小时前
Python 哨兵值模式(Sentinel Value Pattern)深度解析
开发语言·python·sentinel
weixin_4585801219 小时前
怎么通过Node.js监控MongoDB的慢查询_监听数据库事件或利用APM工具集成
jvm·数据库·python