使用pdf2image pdf转图片

安装poppler https://wenku.csdn.net/answer/1zxh8ckp6i

python 复制代码
from pdf2image import convert_from_path, convert_from_bytes
import os


# https://github.com/Belval/pdf2image

output_folder = './'
dpi_value= 600
pdf_start_page = 1 # pdf显示的第一页
start_page = 237 # 真实页码
prex = '' # 图像前缀

def to_image():
    def page_generator():
        while True:
            yield prex
    images = convert_from_path(r'xxx.pdf', dpi=600 ,output_folder=output_folder,
    first_page=pdf_start_page,fmt='jpg',thread_count=6 , output_file=page_generator())
    # convert_from_path(pdf_path, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False, timeout=600, hide_attributes=False)


# 结果 prex-237.jpg
def image_rename():
    # 文件重命名
    global start_page
    file_list = os.listdir(output_folder)
    for file in file_list:
        start_page_str = prex + str(start_page)
        path = os.path.join(output_folder, file)
        print(os.path.join(output_folder, start_page_str + '.jpg'))
        os.rename(path, os.path.join(output_folder, start_page_str + '.jpg'))
        start_page = start_page + 1
to_image()
image_rename()
相关推荐
诸葛大钢铁1 小时前
如何拆分PDF文件?快速拆分PDF文件的2个方法
pdf·pdf拆分
CodeCraft Studio4 小时前
国产化PDF处理控件Spire.PDF教程:在Java快速解析PDF文本、表格、图像和元数据
java·python·pdf·pdf解析·spire.pdf·元数据解析·java pdf解析
计算机视觉-Archer4 小时前
【免费pdf加水印】Adobe Acrobat PDF
pdf
程序员哈基耄21 小时前
本地化PDF工具箱:安全、高效的文档处理解决方案
安全·pdf
qq_451119551 天前
visio 导出pdf无边框无空白边距
pdf
yesyesido1 天前
PDF全能处理平台:高效压缩、精准拆分与智能合并的一站式解决方案
pdf
优选资源分享1 天前
CubePDF Page v5.1.4 | 高效 PDF 合并拆分工具
pdf
浩浩的科研笔记1 天前
投论文常用技术笔记-使用visio导出贴合图像尺寸大小的PDF(无白边、无黑框)
笔记·pdf·论文笔记
m5655bj1 天前
如何通过 C# 将 Markdown 转换为 PDF 文档
开发语言·pdf·c#
stereohomology1 天前
解决某些Typora主题导出PDF分页拦腰截断文字或图片等问题的方法
pdf