如何在 Java 中查找 PDF 页面大小(教程)

PDF 文件并未被 Java 直接支持。本教程将向您展示如何使用 JPedal Java PDF 库 以简单的步骤提取 PDF 文件的页面大小(高度和宽度)。页面大小可以以 厘米、英寸或像素 为单位获取。

为什么要使用第三方库处理 PDF 文件?

PDF 文件是一种复杂的二进制/文本混合数据结构,它是更复杂的 Postscript 格式 的一个子集。因此,直接处理 PDF 可能会非常困难。在本示例中,我们将使用 JPedal Java PDF 库 来简化此任务。

如何在 Java 中查找 PDF 页面大小

• 将 JPedal 添加到您的类或模块路径。(下载试用版 JAR 文件)

• 创建一个指向 PDF 文件的 File 句柄、InputStream 或 URL。

• 如果文件受密码保护,请提供密码。

• 打开 PDF 文件。

• 提取每一页的数据。

• 关闭 PDF 文件。

Java 代码示例:获取 PDF 页面大小

PdfUtilities extract=new PdfUtilities(path);

extract.setPassword("password"); //if needed

int pageCount = extract.getPageCount();

for (int page = 1; page <= pageCount; page++) {

if (extract.openPDFFile()) {

float[] pageDimensions = extract.getPageDimensions(pageNum,

PageUnits.Inches, PageSizeType.CropBox);

}

}

extract.closePDFfile();

相关资源

1 博客文章:解释 MediaBox 和 CropBox 如何定义 PDF 页面大小

2 Javadoc 文档:

:定义是否使用 MediaBox 或 CropBox(如果不确定,建议使用 CropBox)

PageUnits 类:定义尺寸单位

PageUtilities 类:文档工具类的详细说明

我们的主页: PDF 转 HTML5、Java 图像库、Java PDF SDK - IDRsolutions

相关推荐
用户9083246027326 分钟前
Spring AI 1.1.2 + Neo4j:用知识图谱增强 RAG 检索(上篇:图谱构建)
java·spring boot
小王和八蛋34 分钟前
DecimalFormat 与 BigDecimal
java·后端
beata1 小时前
Java基础-16:Java内置锁的四种状态及其转换机制详解-从无锁到重量级锁的进化与优化指南
java·后端
IT探险家1 小时前
你的第一个 Java 程序就翻车?HelloWorld 的 8 个隐藏陷阱
java
随风飘的云1 小时前
SpringBoot 的自动配置原理
java
SimonKing1 小时前
觅得又一款轻量级数据库管理工具:GoNavi
java·后端·程序员
Seven972 小时前
BIO详解:解锁阻塞IO的使用方式
java
oak隔壁找我12 小时前
JVM常用调优参数
java·后端
蝎子莱莱爱打怪16 小时前
OpenClaw 从零配置指南:接入飞书 + 常用命令 + 原理图解
java·后端·ai编程
狼爷18 小时前
Go 没有 override?别硬套继承!用接口+嵌入,写更清爽的“覆盖”逻辑
java·go