pdf转图片(利用pdf2image包)

参考: pdf2image

python 复制代码
pip install pdf2image

代码:

python 复制代码
from pdf2image import convert_from_path, convert_from_bytes
import os

output_folder = './xx/'
dpi_value= 600
pdf_start_page = 1 # pdf显示的第一页
start_page = 1 # 真实页码
prex = '' # 图像前缀

def to_image():
    def page_generator():# 定义图像前缀
        while True:
            yield prex
    images = convert_from_path(r'xx.pdf', dpi=600, output_folder=output_folder,
                               first_page=pdf_start_page, fmt='jpg', thread_count=6, output_file=page_generator())
   


 
def image_rename():
    # 文件重命名
    global start_page
    file_list = os.listdir(output_folder)
    for file in file_list:
        start_page_str =  str(start_page)
        if len(start_page_str)==1:
            start_page_str = '00'+start_page_str
        elif len(start_page_str)==2:
            start_page_str = '0'+start_page_str
        else:
            ...
        path = os.path.join(output_folder, file)
        print(os.path.join(output_folder, start_page_str + '.jpg'))
        os.rename(path, os.path.join(output_folder, start_page_str + '.jpg'))
        start_page = start_page + 1
to_image()
image_rename() #文件重命名

效果:非常快

相关推荐
南风微微吹5 小时前
2015-2025年英语六级历年真题及答案解析电子版PDF(含听力音频)
pdf·英语六级
小为资料库8 小时前
2026年初级社会工作者考试历年真题及答案解析电子版pdf(2010-2025年)
pdf
AI玫瑰助手9 小时前
PDF 转 Markdown 主力方案怎么选:PaddleOCR-VL-1.5、MinerU、HunyuanOCR 与 MonkeyOCR 实测对比
pdf·大模型·知识库·表格·md·文字识别·paddleocr
其实秋天的枫10 小时前
【2026年5月】初级会计师考试真题试卷及答案PDF
经验分享·pdf
小为资料库11 小时前
英语六级听力历年真题汇总电子版PDF(含听力音频mp3、答案解析及听力原文)
pdf·音视频
usdoc文档预览12 小时前
国产化踩坑:Vue3 / React / 小程序如何免插件实现 OFD 及复杂 Office 文档同屏预览
前端·javascript·react.js·小程序·pdf·word·office文件在线预览
小婷资料库12 小时前
河北省中考历年真题及答案解析9科全电子版PDF(2008-2025年)
pdf
优化控制仿真模型12 小时前
【2026年5月最新】初级会计师考试真题试卷及答案PDF
经验分享·pdf
小为资料库12 小时前
英语四级听力历年真题汇总电子版PDF(含听力音频mp3、答案解析及听力原文)
pdf·音视频
小短腿的代码世界13 小时前
KDReports源码深度解析:Qt报表引擎如何做到“所见即所得“?从模板引擎到PDF导出的完整渲染管线揭秘
网络·qt·pdf