使用pdf2image pdf转图片

安装poppler https://wenku.csdn.net/answer/1zxh8ckp6i

python 复制代码
from pdf2image import convert_from_path, convert_from_bytes
import os


# https://github.com/Belval/pdf2image

output_folder = './'
dpi_value= 600
pdf_start_page = 1 # pdf显示的第一页
start_page = 237 # 真实页码
prex = '' # 图像前缀

def to_image():
    def page_generator():
        while True:
            yield prex
    images = convert_from_path(r'xxx.pdf', dpi=600 ,output_folder=output_folder,
    first_page=pdf_start_page,fmt='jpg',thread_count=6 , output_file=page_generator())
    # convert_from_path(pdf_path, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False, timeout=600, hide_attributes=False)


# 结果 prex-237.jpg
def image_rename():
    # 文件重命名
    global start_page
    file_list = os.listdir(output_folder)
    for file in file_list:
        start_page_str = prex + str(start_page)
        path = os.path.join(output_folder, file)
        print(os.path.join(output_folder, start_page_str + '.jpg'))
        os.rename(path, os.path.join(output_folder, start_page_str + '.jpg'))
        start_page = start_page + 1
to_image()
image_rename()
相关推荐
就叫飞六吧10 小时前
pdf转国产ofd格式代码案例-Java
java·python·pdf
步里软件11 小时前
2424.自动将截图组合成PPT的软件:一款截图合并工具的开发与实践
pdf·截图·截图合并工具·区域截图软件·截图转pdf工具·批量截图管理·长图拼接工具
TextIn智能文档云平台11 小时前
如何使用大模型处理图片和PDF并抽取信息?
pdf
winfredzhang11 小时前
用 Python 手搓一个 PDF 编辑器:wxPython 与 PyMuPDF 实战详解
python·pdf·合并·缩略图·书签
季春二九11 小时前
PDF24 Creator丨多功能PDF编辑丨转换丨压缩丨文本识别
pdf·pdf24 creator
ZeroNews内网穿透1 天前
公网访问开源 Stirling-PDF 工具,提升办公效率
linux·运维·服务器·网络·pdf·ssh
千天夜1 天前
Python合并多个PDF文件:完整指南与实践
windows·python·算法·pdf
Redundantº1 天前
Uniapp 适配安卓与 iOS 的 PDF、DOC 文件上传
android·ios·pdf·uni-app·webview
旺旺的碎冰冰~1 天前
Adobe如何给PDF添加页码
adobe·pdf
YANshangqian1 天前
PDF工具箱 PDF24
pdf