Java实现裁剪PDF

目录

[安装Java PDF库](#安装Java PDF库)

Java裁剪PDF页面

Java裁剪PDF页面并将结果保存为图片、HTML、Excel等格式


裁剪PDF页面是一项常见的任务,它可以用来调整文档的尺寸和去除不需要的边距或白边。通过裁剪页面,你可以优化文档的布局和展示效果,使其更符合你的需求。这篇文章将介绍如何使用 Java 实现裁剪PDF 文档的页面,主要包括以下内容:

  • Java裁剪PDF页面
  • Java裁剪PDF页面并将结果保存为图片、HTML、Excel等格式

安装Java PDF库

要裁剪PDF页面,可以使用Spire.PDF for Java 库。

Spire.PDF for Java是一款专门为Java开发人员设计的PDF文档处理库。它支持在Java应用程序中创建、读取、编辑、转换和打印PDF文档。你可以使用以下代码来从Maven仓库安装它:

java 复制代码
<repositories>

    <repository>

        <id>com.e-iceblue</id>

        <name>e-iceblue</name>

        <url>https://repo.e-iceblue.cn/repository/maven-public/</url>

    </repository>

</repositories>

<dependency>

    <groupId>e-iceblue</groupId>

    <artifactId>spire.pdf</artifactId>

    <version>10.4.9</version>

</dependency>

Java裁剪PDF页面

Spire.PDF for Java提供了**PdfPageBase.setCropBox(Rectangle2D rect)**方法,支持裁剪PDF页面。具体步骤如下:

  • 创建PdfDocument类的实例。
  • 使用**PdfDocument.loadFromFile()**方法加载PDF文档。
  • 使用**PdfDocument.getPages().get(index)**方法获取你希望裁剪的页面。
  • 创建Rectangle2D对象,用于定义裁剪的页面区域。
  • 使用**PdfPageBase.setCropBox(Rectangle2D rect)**方法裁剪页面。
  • 使用**PdfDocument.SaveToFile()**方法保存结果文档。
java 复制代码
import com.spire.pdf.PdfDocument;
import com.spire.pdf.PdfPageBase;

import java.awt.*;
import java.awt.geom.Rectangle2D;

public class Main {
    public static void main(String[] args) {
        //创建PdfDocument实例
        PdfDocument pdf = new PdfDocument();

        //加载PDF文档
        pdf.loadFromFile("示例.pdf");

        //获取第一页
        PdfPageBase page = pdf.getPages().get(0);

        //创建Rectangle2D实例用于指定裁剪的页面区域
        Rectangle2D rect = new Rectangle(30, 280, 552, 220);

        //裁剪第一页
        page.setCropBox(rect);

        //保存结果文档
        pdf.saveToFile("裁剪.pdf");
        pdf.close();
    }
}

Java裁剪PDF页面并将结果保存为图片、HTML、Excel等格式

有时候,你可能需要裁剪PDF页面并将结果保存为其他格式,例如图片、HTML或Excel等,以便在其他地方使用。Spire.PDF for Java提供了PdfDocument.saveAsImage() 方法来将PDF文档保存为图片,以及**PdfDocument.saveToFile()**方法来将PDF文档保存为其他格式如HTML、Excel等。

以下步骤展示了如何裁剪一个PDF文档的特定页面并将结果保存为图片:

  • 创建PdfDocument类的实例。
  • 使用**PdfDocument.loadFromFile()**方法加载PDF文档。
  • 使用**PdfDocument.getPages().get(index)**方法获取你希望裁剪的页面。
  • 创建Rectangle2D对象,用于定义裁剪的页面区域。
  • 使用**PdfPageBase.setCropBox(Rectangle2D rect)**方法裁剪页面。
  • 使用PdfDocument.saveAsImage(int pageIndex, PdfImageType type) 方法将该页面保存为BufferedImage对象。
  • BufferedImage对象保存为PNG图片文件。
java 复制代码
import com.spire.pdf.PdfDocument;
import com.spire.pdf.PdfPageBase;
import com.spire.pdf.graphics.PdfImageType;

import javax.imageio.ImageIO;
import java.awt.*;
import java.awt.geom.Rectangle2D;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;

public class CropPageAndSaveItAsImage {
    public static void main(String[] args) throws IOException {
        //创建PdfDocument实例
        PdfDocument pdf = new PdfDocument();

        //加载PDF文档
        pdf.loadFromFile("sample.pdf");

        //获取第一页
        PdfPageBase page = pdf.getPages().get(0);

        //创建Rectangle2D实例用于指定裁剪的页面区域
        Rectangle2D rect = new Rectangle(30, 280, 552, 220);

        //裁剪页面
        page.setCropBox(rect);

        //将第一页保存为图片
        BufferedImage image = pdf.saveAsImage(0, PdfImageType.Bitmap);

        //将图片保存为PNG文件
        File file = new File("cropped.png");
        ImageIO.write(image, "PNG", file);

        pdf.close();
    }
}

以下步骤展示了如何裁剪一个PDF文档的特定页面并将结果保存为HTML、Excel、OFD等格式:

  • 创建PdfDocument类的实例。
  • 使用**PdfDocument.loadFromFile()**方法加载PDF文档。
  • 使用**PdfDocument.getPages().get(index)**方法获取你希望裁剪的页面。
  • 创建Rectangle2D对象,用于定义裁剪的页面区域。
  • 使用**PdfPageBase.setCropBox(Rectangle2D rect)**方法裁剪页面。
  • 创建另一个PdfDocument类的实例来生产一个新的PDF文档。
  • 使用**PdfDocument.insertPage()**方法将裁剪后的页面插入新的PDF文档。
  • 使用**PdfDocument.saveToFile()**方法将新的PDF文档保存为HTML/EXCEL/OFD等格式。
java 复制代码
import com.spire.pdf.FileFormat;
import com.spire.pdf.PdfDocument;
import com.spire.pdf.PdfPageBase;

import java.awt.*;
import java.awt.geom.Rectangle2D;

public class CropPageAndSaveItAsHtmlExcel {
    public static void main(String[] args){
        //创建PdfDocument实例
        PdfDocument pdf = new PdfDocument();

        //加载PDF文档
        pdf.loadFromFile("sample.pdf");

        //获取第一页
        PdfPageBase page = pdf.getPages().get(0);

        //创建Rectangle2D实例用于指定裁剪的页面区域
        Rectangle2D rect = new Rectangle(30, 280, 552, 220);

        //裁剪页面
        page.setCropBox(rect);

        //创建一个新的PDF文档
        PdfDocument newPdf = new PdfDocument();
        //将裁剪后的页面插入到新的PDF文档 
        newPdf.insertPage(pdf, page);

        //将新的PDF文档保存为HTML/XLSX/OFD等其他格式
        newPdf.saveToFile("cropped.html", FileFormat.HTML);
        newPdf.saveToFile("cropped.xlsx", FileFormat.XLSX);
        newPdf.saveToFile("cropped.ofd", FileFormat.OFD);
        
        newPdf.close();
        pdf.close();
    }
}

除了以上代码中保存的格式外,你还可以将裁剪结果保存为很多其他格式,如**.doc** ,.docx ,.xps 等,修改FileFormat枚举即可。

相关推荐
蜡笔小新..17 分钟前
R语言和RStudio安装
开发语言·r语言
ALPH_17 分钟前
R语言的基础命令及实例操作
开发语言·数据分析·r语言·perl·r语言-4.2.1
咩咩觉主21 分钟前
C# &Unity 唐老狮 No.6 模拟面试题
开发语言·unity·面试·c#·游戏引擎·唐老师
╰つ゛木槿3 小时前
Spring Boot 调用DeepSeek API的详细教程
java·spring boot·后端·deepseek
*.✧屠苏隐遥(ノ◕ヮ◕)ノ*.✧3 小时前
C语言_数据结构总结8:链式队列
c语言·开发语言·数据结构·链表·visualstudio·visual studio
千里码aicood3 小时前
[含文档+PPT+源码等]精品基于Python实现的校园小助手小程序的设计与实现
开发语言·前端·python
讨厌下雨的天空3 小时前
C++之list
开发语言·c++·list
大麦大麦3 小时前
深入剖析 Sass:从基础到进阶的 CSS 预处理器应用指南
开发语言·前端·css·面试·rust·uni-app·sass
hhw1991124 小时前
c#面试题整理6
java·开发语言·c#
蠟筆小新工程師4 小时前
Deepseek可以通过多种方式帮助CAD加速工作
开发语言·python·seepdeek