PDF 文件并未被 Java 直接支持。本教程将向您展示如何使用 JPedal Java PDF 库 以简单的步骤提取 PDF 文件的页面大小(高度和宽度)。页面大小可以以 厘米、英寸或像素 为单位获取。
为什么要使用第三方库处理 PDF 文件?
PDF 文件是一种复杂的二进制/文本混合数据结构,它是更复杂的 Postscript 格式 的一个子集。因此,直接处理 PDF 可能会非常困难。在本示例中,我们将使用 JPedal Java PDF 库 来简化此任务。
如何在 Java 中查找 PDF 页面大小
• 将 JPedal 添加到您的类或模块路径。(下载试用版 JAR 文件)
• 创建一个指向 PDF 文件的 File 句柄、InputStream 或 URL。
• 如果文件受密码保护,请提供密码。
• 打开 PDF 文件。
• 提取每一页的数据。
• 关闭 PDF 文件。
Java 代码示例:获取 PDF 页面大小
PdfUtilities extract=new PdfUtilities(path);
extract.setPassword("password"); //if needed
int pageCount = extract.getPageCount();
for (int page = 1; page <= pageCount; page++) {
if (extract.openPDFFile()) {
float[] pageDimensions = extract.getPageDimensions(pageNum,
PageUnits.Inches, PageSizeType.CropBox);
}
}
extract.closePDFfile();
相关资源
1 博客文章:解释 MediaBox 和 CropBox 如何定义 PDF 页面大小
2 Javadoc 文档:
:定义是否使用 MediaBox 或 CropBox(如果不确定,建议使用 CropBox)
PageUnits 类:定义尺寸单位
PageUtilities 类:文档工具类的详细说明