【python】PDF转长图

PDF转化成长图

步骤:

复制代码
   pip install pdf2image
  1. 下载依赖文件poppler

  2. 上代码

    python 复制代码
    # 导入所需的库
    from PIL import Image
    import fitz
    from pdf2image import convert_from_path
    
    # 定义PDF文件路径、保存图像路径和Poppler路径
    pdf_file = r'D:\workspace\python学习笔记.pdf'
    save_path = r'D:\workspace\long_image.png'
    poppler_path = r"D:\app\poppler_2\bin"
    
    # 将PDF文件转换为图像列表
    image_list = convert_from_path(pdf_file, poppler_path=poppler_path)
    
    # 获取第一个图像的尺寸
    page_width, page_height = image_list[0].size
    
    # 创建一个与所有图像大小相同的画布
    merged_image = Image.new("RGB", (page_width, page_height * len(image_list)), (255, 255, 255))
    
    # 将所有图像粘贴到画布上
    for i, image in enumerate(image_list):
        merged_image.paste(image, (0, i * page_height))
    
    # 将画布保存为一张长图
    merged_image.save(save_path)
相关推荐
Oo92014 分钟前
Prompt工程核心与Python 字典
python·ai编程
暖焰核心16 分钟前
C++内存管理和模板初阶
开发语言·c++
feeday24 分钟前
gpt4o 图像反推提示词
开发语言·人工智能·python
Irissgwe30 分钟前
c++智能指针
开发语言·c++
沈浩(种子思维作者)41 分钟前
没有错误,正确将一文不值
人工智能·python·算法·量子计算
AZaLEan__1 小时前
多源 BFS
java·开发语言·算法
smith成长之旅1 小时前
06 | Mem0 框架分析:为什么要从记忆中提取实体?——Entity Store 的设计动机与工程实现
人工智能·python
smith成长之旅1 小时前
07 | Mem0 框架分析:三路信号融合——语义 + BM25 + Entity Boost 的混合检索
python·算法
笨蛋不要掉眼泪1 小时前
Java并发编程 :深入剖析LinkedBlockingQueue
java·开发语言·网络·并发
不会C语言的男孩1 小时前
C++ Primer Plus 第10章:对象和类
开发语言·c++