pdf转图片(利用pdf2image包)

参考: pdf2image

python 复制代码
pip install pdf2image

代码:

python 复制代码
from pdf2image import convert_from_path, convert_from_bytes
import os

output_folder = './xx/'
dpi_value= 600
pdf_start_page = 1 # pdf显示的第一页
start_page = 1 # 真实页码
prex = '' # 图像前缀

def to_image():
    def page_generator():# 定义图像前缀
        while True:
            yield prex
    images = convert_from_path(r'xx.pdf', dpi=600, output_folder=output_folder,
                               first_page=pdf_start_page, fmt='jpg', thread_count=6, output_file=page_generator())
   


 
def image_rename():
    # 文件重命名
    global start_page
    file_list = os.listdir(output_folder)
    for file in file_list:
        start_page_str =  str(start_page)
        if len(start_page_str)==1:
            start_page_str = '00'+start_page_str
        elif len(start_page_str)==2:
            start_page_str = '0'+start_page_str
        else:
            ...
        path = os.path.join(output_folder, file)
        print(os.path.join(output_folder, start_page_str + '.jpg'))
        os.rename(path, os.path.join(output_folder, start_page_str + '.jpg'))
        start_page = start_page + 1
to_image()
image_rename() #文件重命名

效果:非常快

相关推荐
SEO-狼术4 小时前
Direct PDF Printing to .NET Applications
pdf
zyplayer-doc19 小时前
目录支持批量操作,文档增加可见范围、锁定功能,PDF查看优化,zyplayer-doc 2.5.8 发布啦!
数据库·人工智能·pdf·编辑器·飞书·石墨文档
2501_930707781 天前
如何使用C#代码在 PDF 文档添加页码
pdf
AI人工智能+1 天前
文档抽取技术结合OCR、NLP和计算机视觉,能智能提取PDF、扫描件等版式文档中的结构化数据
pdf·ocr·文档抽取
梵克之泪1 天前
根据表格内容和模板文件批量创建word文件,一次性生成多个word文档和批量生成创建PDF文件
pdf·word
December3101 天前
【图文教程】图片转pdf,从入门到精通
pdf·图片·格式转换·图片转换·图片转pdf·图转pdf
g***96901 天前
【Spring Boot 实现 PDF 导出】
spring boot·后端·pdf
zyplayer-doc2 天前
重写OFD查看器,完善PDF查看器,增加搜索历史记录、滚动分页、目录排序等,zyplayer-doc 2.5.7 发布啦!
pdf·编辑器·飞书·开源软件·创业创新·有道云笔记
傻啦嘿哟2 天前
Python实现PDF文档高效转换为HTML文件:从基础到进阶的完整指南
python·pdf·html
流浪猪头拯救地球2 天前
利用 Python 解密 / 加密 PDF 文件
python·pdf·php