使用pdf2image pdf转图片

安装poppler https://wenku.csdn.net/answer/1zxh8ckp6i

python 复制代码
from pdf2image import convert_from_path, convert_from_bytes
import os


# https://github.com/Belval/pdf2image

output_folder = './'
dpi_value= 600
pdf_start_page = 1 # pdf显示的第一页
start_page = 237 # 真实页码
prex = '' # 图像前缀

def to_image():
    def page_generator():
        while True:
            yield prex
    images = convert_from_path(r'xxx.pdf', dpi=600 ,output_folder=output_folder,
    first_page=pdf_start_page,fmt='jpg',thread_count=6 , output_file=page_generator())
    # convert_from_path(pdf_path, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False, timeout=600, hide_attributes=False)


# 结果 prex-237.jpg
def image_rename():
    # 文件重命名
    global start_page
    file_list = os.listdir(output_folder)
    for file in file_list:
        start_page_str = prex + str(start_page)
        path = os.path.join(output_folder, file)
        print(os.path.join(output_folder, start_page_str + '.jpg'))
        os.rename(path, os.path.join(output_folder, start_page_str + '.jpg'))
        start_page = start_page + 1
to_image()
image_rename()
相关推荐
一个处女座的程序猿10 小时前
LLMs之PDF:zeroX(一款PDF到Markdown 的视觉模型转换工具)的简介、安装和使用方法、案例应用之详细攻略
pdf·markdown·zerox
Dxy123931021610 小时前
python下载pdf
数据库·python·pdf
周亚鑫10 小时前
vue3 pdf base64转成文件流打开
前端·javascript·pdf
一名技术极客12 小时前
Vue2 doc、excel、pdf、ppt、txt、图片以及视频等在线预览
pdf·powerpoint·excel·文件在线预览
S. Dylan1 天前
Edge浏览器打开PDF无法显示电子签章
edge·pdf
一马平川的大草原1 天前
如何基于pdf2image实现pdf批量转换为图片
计算机视觉·pdf·文件拆分
m0_594526301 天前
Python批量合并多个PDF
java·python·pdf
hairenjing11231 天前
将图片添加到 PDF 的 5 种方法
pdf
✿゚卡笨卡1 天前
pdf 添加页眉页脚,获取前五页
java·pdf
blegn1 天前
PDF编辑工具Adobe Acrobat DC 2023安装教程(附安装包)
pdf·办公软件·office