学习python调用pymupdf库将pdf文件转换为图片的基本用法

  PyMuPDF(也称fitz)是用于处理PDF、XPS、EPUB、MOBI等文档格式的高性能Python库,基于轻量级的MuPDF渲染器构建,在速度和内存效率方面表现出色,适合在数据处理和RAG应用中使用。本文学习调用pymupdf库将pdf文件转换为图片的基本用法。
  运行下面的命令安装pymupdf库。

bash 复制代码
pip install pymupdf


  主要涉及的类包括调用pymupdf类打开pdf文档并获取每页数据、调用page类将页面转换为图片、调用Pixmap类保存图片,函数说明如下所示:


  最后是示例代码及运行效果,下面的程序将指定的2页pdf文件逐页保存为图片。

python 复制代码
import pymupdf

filename="What is a Vertical Handovera.pdf"
doc = pymupdf.open(filename)

pageindex=1

for page in doc:
    pix=page.get_pixmap()
    pix.save(f"{filename}_page_{pageindex}.png")
    pageindex=pageindex+1

doc.close()

参考文献:

1https://pymupdf.readthedocs.io/en/latest/index.html

2https://pymupdf.readthedocs.io/en/latest/page.html

3https://pymupdf.readthedocs.io/en/latest/pixmap.html

相关推荐
心中有国也有家2 小时前
GE图引擎深度解析——CANN的计算图优化与执行引擎
人工智能·pytorch·python·学习·numpy
卷毛的技术笔记3 小时前
告别硬编码!Spring AI Alibaba 实现 AI Agent 智能工具调用(Tool Calling)
java·人工智能·后端·python·spring·ai编程
编程大师哥3 小时前
匿名函数 lambda + 高阶函数
java·python·算法
vb2008113 小时前
FastAPI APIRouter
开发语言·python
adrninistrat0r4 小时前
Java调用链MCP分析工具
java·python·ai编程
杨充4 小时前
1.3 浮点型数据设计灵魂
开发语言·python·算法
meilindehuzi_a5 小时前
深入浅出数据结构:Python 字典(Dict)与集合(Set)的哈希表底层全链路追踪
数据结构·python·散列表
Lucas凉皮5 小时前
20243408 2025-2026-2 《Python程序设计》综合实践报告
python·实验报告
键盘上的猫头鹰5 小时前
【MySQL 教程(八)】索引、事务、用户管理、导入导出与分页查询
数据库·python·mysql
薛定谔的猫-菜鸟程序员6 小时前
2小时智能体开发一个智能体?我用CodeArts Agent 和 AtomCode 开发了一个适老化智能体。
人工智能·python·agent