Java操作Miscrosoft Office各类文件格式的开源免费工具库

Aspose.Words库
复制代码
是一个商业Java库,还封装了常用的word、pdf、防伪码、水印等诸多功能。

Apache 库需要注意的前置问题

复制代码
问题1:Word的两个格式doc和docx,POI并没有提供统一的处理类。分别用 HWPFDocument 处理doc文档,用 XWPFTemplate 处理docx文档。
HWPFDocument 处理doc文档
XWPFTemplate 处理docx文档
解决方法1:将.doc文件转成.docx格式,处理完后再转回来。
解决方法2:(待验证)可以前置统一将.doc名字重命名成.docx,如果严格要求格式,处理完后再把名字改回去。
Excel(xls和xlsx)同理。
Miscrosoft Office各类文件格式的读写:
复制代码
Apache POI库
Apache POI是一个开源的Java库,用于操作Microsoft Office格式的文件。
它支持各种Office文档的读写功能,包括Word文档、Excel电子表格、PowerPoint演示文稿、Outlook电子邮件等。
Apache POI提供了一组API,使得Java开发者能够轻松地在Java应用程序中处理Office文件。
Java 将 Word 文档转换为 PDF
复制代码
使用PdfConverter工具类,如下:
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.converter.pdf.PdfConverter;
import org.apache.poi.xwpf.converter.pdf.PdfOptions;
public class Word2PdfByApachePOI {
	public start void main(String[] args) throws Exception {
		// 读取word目标文件
		XWPFDocument docx = new XWPFDocument(new FileInputStream("xxxx/input.docx"));
	
		//创建pdf选项
		PdfOptions options = PdfOptions.create();
		
		// word转为pdf
		PdfConverter.getInstance().convert(docx, new FileOutputStream("output.pdf"),options);
	}
}
PDF操作
复制代码
Apache PDFBox库是一个开源的Java工具,专门用于处理PDF文档。
它允许用户创建全新的PDF文件,编辑现有的PDF文档,以及从PDF文件中提取内容。

功能:创建、渲染、打印、合并、拆分、加密、解密、签名等多种操作PDF文件的功能,包括一个命令行工具,可以用于执行各种PDF处理任务。
支持文本提取和搜索,以及将PDF转换为其他格式,如图片和文本。

Apache PDFBox具备以下主要功能:
	从PDF文件中提取Unicode文本。
	将单个PDF文件拆分成多个文件,或将多个PDF文件合并成一个。
	从PDF表单中提取数据,或填写PDF表单。
	验证PDF文件是否符合PDF/A-1b标准。
	使用标准的Java打印API打印PDF文件。
	将PDF文件另存为图像格式,如PNG或JPEG。
	从零开始创建PDF文件,包括嵌入字体和图像。
	对PDF文件进行数字签名。
相关推荐
HAH-HAH19 小时前
【Python 入门】(2)Python 语言基础(变量)
开发语言·python·学习·青少年编程·个人开发·变量·python 语法
Bellafu66620 小时前
spring项目部署后为什么会生成 logback-spring.xml文件
java
递归不收敛20 小时前
一、Java 基础入门:从 0 到 1 认识 Java(详细笔记)
java·开发语言·笔记
沐浴露z20 小时前
【Java SpringAI智能体开发学习 | 2】SpringAI 实用特性:自定义Advisor,结构化输出,对话记忆持久化,prompt模板,多模态
java·spring·springai
小沈同学呀20 小时前
创建一个Spring Boot Starter风格的Basic认证SDK
java·spring boot·后端
码农小伙21 小时前
通俗易懂地讲解JAVA的BIO、NIO、AIO
java·nio
zhangfeng113321 小时前
win7 R 4.4.0和RStudio1.25的版本兼容性以及系统区域设置有关 导致Plots绘图面板被禁用,但是单独页面显示
开发语言·人工智能·r语言·生物信息
不要再敲了1 天前
JDBC从入门到面试:全面掌握Java数据库连接技术
java·数据库·面试
说私域1 天前
新零售第一阶段传统零售商的困境突破与二次增长路径:基于定制开发开源AI智能名片S2B2C商城小程序的实践探索
人工智能·开源·零售
潇I洒1 天前
若依4.8.1打包war后在Tomcat无法运行,404报错的一个解决方法
java·tomcat·ruoyi·若依·404