Java:获取pdf中某一页的宽度和高度

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

目录

一、背景介绍

二、用Java中的方法

三、用Python中的方法

总结


提示:以下是本篇文章正文内容,下面案例可供参考

一、背景介绍

金融业务,经常会涉及到合同盖章,那么盖章的时候就需要知道位置信息。比如第几页,X坐标,Y坐标。那么如果给出的坐标超出了范围,就会导致章盖不成功,那么我们怎么才能知道这个pdf文件中某一页的XY坐标呢?

二、用Java中的方法

Maven依赖:

复制代码
<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox</artifactId>
    <version>2.0.8</version>
</dependency>

示例代码:

复制代码
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;


public void 输出pdf页面横纵坐标范围() {
        String pdfPath = "C:\\Users\\86185\\Desktop\\951bb404d7ae4bc0b0152255a6d79c59.pdf";
        try (PDDocument document = PDDocument.load(new File(pdfPath))) {
            PDPage page = document.getPage(1);
            float width = page.getMediaBox().getWidth();
            float height = page.getMediaBox().getHeight();
            System.out.println("页面宽度:" + width);
            System.out.println("页面高度:" + height);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

三、用Python中的方法

代码示例:

python 复制代码
import PyPDF2

def get_page_dimensions(pdf_path, page_number):
    with open(pdf_path, 'rb') as file:
        reader = PyPDF2.PdfFileReader(file)
        if page_number < 1 or page_number > reader.numPages:
            return None
        page = reader.getPage(page_number - 1)
        width = page.mediaBox.getWidth()
        height = page.mediaBox.getHeight()
        return width, height

pdf_path = 'your_pdf_file.pdf'
page_number = 1

dimensions = get_page_dimensions(pdf_path, page_number)
if dimensions:
    print("页面宽度:", dimensions[0])
    print("页面高度:", dimensions[1])
else:
    print("无效的页码")

总结

各种工具类的使用,重在积累,不难,但是要找一翻。

相关推荐
夏日白云14 小时前
《PDF解析工程实录》第 8 章|融合策略:不是兜底,而是信息利用率最大化
pdf·llm·大语言模型·rag·文档解析
m5655bj15 小时前
通过 Python 提取 PDF 表格数据
服务器·python·pdf
清平乐的技术专栏15 小时前
电脑自带Edge浏览器进行PDF文件合并
前端·edge·pdf
Irene199116 小时前
文档加密加水印只读分享:WPS/PPT编辑后导出PDF(附:百度网盘分享流程)
pdf·加密·wps·pptx·只读
2501_9307077817 小时前
使用C#代码重新排列 PDF 页面
开发语言·pdf·c#
南风微微吹17 小时前
【2026年3月】计算机二级WPS真题试卷及解析14套~电子版PDF
pdf·wps·计算机二级wps
夏日白云19 小时前
《PDF解析工程实录》第 9 章|端到端多模态模型:不是接不住,而是要看业务能接受什么
pdf·llm·大语言模型·多模态·rag·文档解析
机器学习算法与Python实战1 天前
PDF 文件翻译,我有4个方案推荐
pdf
manjianghong862 天前
如何将一本书PDF扫描件转word 并打印(免费工具)
pdf·word·pdf处理工具
zhangfeng11333 天前
大语言模型llm学习路线电子书 PDF、开源项目、数据集、视频课程、面试题、工具镜像汇总成一张「一键下载清单」
学习·语言模型·pdf