Python pdf2imges -- pdf文件转图片

pdf文件转图片,需要安装PyMuPDF包,具体PyMuPDF包介绍可以参考:Python 处理 PDF 的神器 -- PyMuPDF

python 复制代码
import fitz    # pip install PyMuPDF

# PDF转换为IMG统一管理
def pdf_to_images(pdf_path, img_path, filename):
    """
    pdf_path: pdf路径
    img_path: images生成得文件路径
    filename: 文件名称
    """
    #  打开PDF文件,生成一个对象
    doc = fitz.open(pdf_path + filename)
    for pg in range(doc.page_count):
        page = doc[pg]
        rotate = int(0)
        # 每个尺寸的缩放系数为2,这将为我们生成分辨率提高四倍的图像。
        zoom_x = 2.0
        zoom_y = 2.0
        trans = fitz.Matrix(zoom_x, zoom_y).prerotate(rotate)
        pm = page.get_pixmap(matrix=trans, alpha=False)
        pm.save(f'%s.png' % (img_path + filename[:-4], ))

if __name__ == "__main__":
    pdf_to_images(pdf_file_folder, img_file_folder, filename)
相关推荐
这个人懒得名字都没写6 小时前
Python包管理新纪元:uv
python·conda·pip·uv
有泽改之_6 小时前
leetcode146、OrderedDict与lru_cache
python·leetcode·链表
是毛毛吧6 小时前
边打游戏边学Python的5个开源项目
python·开源·github·开源软件·pygame
三途河畔人7 小时前
Pytho基础语法_运算符
开发语言·python·入门
独行soc8 小时前
2025年渗透测试面试题总结-275(题目+回答)
网络·python·安全·web安全·网络安全·渗透测试·安全狮
番石榴AI9 小时前
java版的ocr推荐引擎——JiaJiaOCR 2.0重磅升级!纯Java CPU推理,新增手写OCR与表格识别
java·python·ocr
时光轻浅,半夏挽歌10 小时前
python不同格式文件的读写方式(json等)
python·json
测试人社区-千羽10 小时前
边缘计算场景下的智能测试挑战
人工智能·python·安全·开源·智能合约·边缘计算·分布式账本
抽象带篮子10 小时前
Pytorch Lightning 框架运行顺序
人工智能·pytorch·python