多页pdf转长图

单页pdf直接打印-onenote-在该页右键,另存为图片即可。

多页pdf,期望保存为一张图片,直接可用的都需要money。可通过python库来完成:

python 复制代码
import os
from pdf2image import convert_from_path
from PIL import Image, ImageDraw


def pdf_to_images(pdf_path, img_path):
    # 转换 PDF 文件为图片
    images = convert_from_path(pdf_path)
    # 遍历图片列表并保存
    paths = []
    for i, image in enumerate(images):
        filePath = os.path.join(img_path, f"page_{i + 1}.jpg")
        if not os.path.exists(img_path):
            os.mkdir(img_path)
        image.save(filePath, "JPEG")
        paths.append(filePath)
    return paths

def stitch_images_vertically(image_paths, output_path, line_color="black", line_height=2):
    """
    将多张图片垂直拼接为一张长图,并在每页末尾添加分割线
    :param image_paths: 图片路径列表
    :param output_path: 输出图片的路径
    :param line_color: 分割线的颜色,默认为黑色
    :param line_height: 分割线的高度,默认为2像素
    """
    # 打开所有图片并获取宽度和高度
    images = [Image.open(img) for img in image_paths]
    widths, heights = zip(*(img.size for img in images))

    # 确定拼接后的图片宽度(取最大宽度)和总高度(包括分割线)
    total_width = max(widths)
    total_height = sum(heights) + line_height * (len(images) - 1)

    # 创建一个新的长图
    new_image = Image.new('RGB', (total_width, total_height), (255, 255, 255))
    draw = ImageDraw.Draw(new_image)

    # 将每张图片粘贴到长图中,并在每页末尾添加分割线
    y_offset = 0
    for img in images[:-1]:  # 不在最后一张图片后添加分割线
        new_image.paste(img, (0, y_offset))
        y_offset += img.height
        # 绘制分割线
        draw.line([(0, y_offset), (total_width, y_offset)], fill=line_color, width=line_height)
        y_offset += line_height

    # 粘贴最后一张图片
    new_image.paste(images[-1], (0, y_offset))

    # 保存长图
    new_image.save(output_path)

# 示例调用
image_paths = pdf_to_images("a.pdf", "./outputs")
output_path = "stitched_image_with_lines.png"  # 替换为输出图片路径
stitch_images_vertically(image_paths, output_path)

若保存的图片过大,可压缩下。比如:

python 复制代码
def compress_image_to_target_size(input_image_path, output_image_path, target_size, step=5):
    """
    将图片压缩到指定大小
    :param input_image_path: 输入图片路径
    :param output_image_path: 输出图片路径
    :param target_size: 目标大小(单位:字节)
    :param step: 质量调整步长
    """
    quality = 95  # 初始质量
    while True:
        with Image.open(input_image_path) as img:
            # 保存图片并调整质量
            img.save(output_image_path, quality=quality)

        # 检查文件大小
        file_size = os.path.getsize(output_image_path)
        if file_size <= target_size or quality <= 0:
            break

        # 调整质量
        quality -= step

    print(f"图片已压缩到 {file_size / (1024 * 1024):.2f} MB")

# 示例调用
compress_image_to_target_size("stitched_image_with_lines.png", "output.jpg", 2 * 1024 * 1024)
相关推荐
2601_9618752419 小时前
高考真题电子版|2025高考全科真题分类PDF
金融·pdf·云计算·azure·七牛云存储·交友·高考
质造者20 小时前
Python 本地 RAG 实战 | Ollama+ChromaDB 实现 PDF 离线智能问答
开发语言·python·pdf·大模型·rag
王莎莎-MinerU20 小时前
从 OCR 到 Context Engineering:用 MinerU 搭一个可复现文档解析评测
人工智能·深度学习·机器学习·pdf·ocr·个人开发
m0_547486661 天前
华南农业大学《数据结构》期末试卷及答案2011-2019 2020-2023年PDF
大数据·数据结构·pdf·华南农业大学
ComPDFKit1 天前
2026 PDF 表格提取工具横评:15 款工具实测对比
pdf·excel·pdf表格提取·pdf to excel·pdf数据提取
m0_547486661 天前
华南农业大学《C语言程序设计》期末试卷及答案2018-2025年PDF
c语言·开发语言·pdf·c语言程序设计
Metaphor6922 天前
使用 Python 给 PDF 设置背景色或背景图
数据库·python·pdf
2601_961845152 天前
新高考一卷真题2025|真题PDF全科整理
线性代数·矩阵·pdf·动态规划·概率论·高考
复园电子2 天前
企业PDF批量盖章开发集成指南:API对接OA/LIMS系统,高并发落地实战
开发语言·python·pdf
2601_961845152 天前
2026四级作文预测题|英语四级写作押题+提纲PDF
java·c语言·数据库·c++·python·pdf·php