Python pdf2imges -- pdf文件转图片

pdf文件转图片,需要安装PyMuPDF包,具体PyMuPDF包介绍可以参考:Python 处理 PDF 的神器 -- PyMuPDF

python 复制代码
import fitz    # pip install PyMuPDF

# PDF转换为IMG统一管理
def pdf_to_images(pdf_path, img_path, filename):
    """
    pdf_path: pdf路径
    img_path: images生成得文件路径
    filename: 文件名称
    """
    #  打开PDF文件,生成一个对象
    doc = fitz.open(pdf_path + filename)
    for pg in range(doc.page_count):
        page = doc[pg]
        rotate = int(0)
        # 每个尺寸的缩放系数为2,这将为我们生成分辨率提高四倍的图像。
        zoom_x = 2.0
        zoom_y = 2.0
        trans = fitz.Matrix(zoom_x, zoom_y).prerotate(rotate)
        pm = page.get_pixmap(matrix=trans, alpha=False)
        pm.save(f'%s.png' % (img_path + filename[:-4], ))

if __name__ == "__main__":
    pdf_to_images(pdf_file_folder, img_file_folder, filename)
相关推荐
深蓝电商API7 分钟前
多线程 vs 异步 vs 多进程爬虫性能对比
爬虫·python
进击的雷神30 分钟前
相对路径拼接、TEL前缀清洗、多链接过滤、毫秒级延迟控制——日本东京塑料展爬虫四大技术难关攻克纪实
爬虫·python
云溪·34 分钟前
Milvus向量数据库混合检索召回案例
python·ai·milvus
柒.梧.42 分钟前
Java集合核心知识点深度解析:数组与集合区别、ArrayList原理及线程安全问题
java·开发语言·python
AsDuang1 小时前
Python 3.12 MagicMethods - 49 - __imatmul__
开发语言·python
小湘西1 小时前
拓扑排序(Topological Sort)
python·设计模式
北京地铁1号线1 小时前
快手面试题:全局解释器锁
python·gil
RechoYit2 小时前
数学建模——评价与决策类模型
python·算法·数学建模·数据分析
南风微微吹2 小时前
【2026大英赛】全国大学生英语竞赛C类历年真题试卷及答案电子版PDF(2012-2025年)
pdf·大英赛
查尔char2 小时前
CentOS 7 编译安装 Python 3.10 并解决 SSL 问题
python·centos·ssl·pip·python3.11