(教程)用 Java 从 PDF 中提取嵌入的文件

PDF 文件有时会引用外部资源,例如图片或其他文档。为了增强这些 PDF 文件的可移植性和便于归档,可以将这些资源嵌入到 PDF 文件中。这些嵌入的资源被称为附件或嵌入文件。

如果你想通过 Java 提取 PDF 中的嵌入文件,需要使用第三方库,因为 Java 本身并不支持对 PDF 文件的直接处理。

在本教程中,我们将使用JPedal 库

如何通过编程方式从 PDF 中提取嵌入的文件

  • 将 JPedal 添加到项目的类路径或模块路径中(可以从官网下载试用版jar 文件
  • 运行以下代码:

ExtractEmbeddedFiles.extractAllFilesFromPdf("inputFile.pdf", "outputFolder");

如何使用命令行从 PDF 中提取嵌入的文件

  • 将 JPedal 添加到类路径或模块路径中(可以从官网下载试用版jar 文件
  • 运行以下命令:

java -cp jpedal.jar org.jpedal.examples.acroform.ExtractEmbeddedFiles inputFile.pdf outputFolder

更多学习资源

如果你希望进一步了解 PDF 格式的知识,可以阅读我们其他的相关文章。如果想了解某个特定的 PDF 术语,我们的PDF术语表涵盖了常见术语的详细解释。

相关推荐
小马爱打代码10 小时前
Spring Boot:模块化实战 - 保持清晰架构
java·spring boot·架构
小坏讲微服务11 小时前
SpringBoot4.0整合knife4j 在线文档完整使用
java·spring cloud·在线文档·knife4j·文档·接口文档·swagger-ui
8***Z8911 小时前
springboot 异步操作
java·spring boot·mybatis
宇钶宇夕11 小时前
三旺 INP314T 网关快速入门指南:从登录到基础配置
运维·自动化·软件工程
i***132411 小时前
Spring BOOT 启动参数
java·spring boot·后端
坚持不懈的大白11 小时前
后端:SpringMVC
java
IT_Octopus11 小时前
(旧)Spring Securit 实现JWT token认证(多平台登录&部分鉴权)
java·后端·spring
kk哥889911 小时前
Spring详解
java·后端·spring
S***267511 小时前
Spring Cloud Gateway 整合Spring Security
java·后端·spring
Tao____11 小时前
开源物联网平台
java·物联网·mqtt·开源·设备对接