Python pdf2imges -- pdf文件转图片

pdf文件转图片,需要安装PyMuPDF包,具体PyMuPDF包介绍可以参考:Python 处理 PDF 的神器 -- PyMuPDF

python 复制代码
import fitz    # pip install PyMuPDF

# PDF转换为IMG统一管理
def pdf_to_images(pdf_path, img_path, filename):
    """
    pdf_path: pdf路径
    img_path: images生成得文件路径
    filename: 文件名称
    """
    #  打开PDF文件,生成一个对象
    doc = fitz.open(pdf_path + filename)
    for pg in range(doc.page_count):
        page = doc[pg]
        rotate = int(0)
        # 每个尺寸的缩放系数为2,这将为我们生成分辨率提高四倍的图像。
        zoom_x = 2.0
        zoom_y = 2.0
        trans = fitz.Matrix(zoom_x, zoom_y).prerotate(rotate)
        pm = page.get_pixmap(matrix=trans, alpha=False)
        pm.save(f'%s.png' % (img_path + filename[:-4], ))

if __name__ == "__main__":
    pdf_to_images(pdf_file_folder, img_file_folder, filename)
相关推荐
想要成为计算机高手18 分钟前
4. isaac sim4.2 教程-Core API-Hello robot
人工智能·python·机器人·英伟达·isaac sim·仿真环境
陈敬雷-充电了么-CEO兼CTO1 小时前
复杂任务攻坚:多模态大模型推理技术从 CoT 数据到 RL 优化的突破之路
人工智能·python·神经网络·自然语言处理·chatgpt·aigc·智能体
YOLO大师1 小时前
华为OD机试 2025B卷 - 小明减肥(C++&Python&JAVA&JS&C语言)
c++·python·华为od·华为od机试·华为od2025b卷·华为机试2025b卷·华为od机试2025b卷
xiao5kou4chang6kai42 小时前
【Python-GEE】如何利用Landsat时间序列影像通过调和回归方法提取农作物特征并进行分类
python·gee·森林监测·洪涝灾害·干旱评估·植被变化
kaikaile19952 小时前
使用Python进行数据可视化的初学者指南
开发语言·python·信息可视化
Par@ish2 小时前
【网络安全】恶意 Python 包“psslib”仿冒 passlib,可导致 Windows 系统关闭
windows·python·web安全
意疏2 小时前
【Python篇】PyCharm 安装与基础配置指南
开发语言·python·pycharm
冬天给予的预感4 小时前
DAY 54 Inception网络及其思考
网络·python·深度学习
钢铁男儿4 小时前
PyQt5高级界而控件(容器:装载更多的控件QDockWidget)
数据库·python·qt
亿牛云爬虫专家8 小时前
Kubernetes下的分布式采集系统设计与实战:趋势监测失效引发的架构进化
分布式·python·架构·kubernetes·爬虫代理·监测·采集