PDF转word

一、引入maven依赖
shell 复制代码
<dependency>
	<groupId>com.aspose</groupId>
	<artifactId>aspose-pdf</artifactId>
	<version>22.10</version>
</dependency>
二、核心代码
java 复制代码
import com.aspose.pdf.Document;
import com.aspose.pdf.PageInfo;
import com.aspose.pdf.SaveFormat;
import java.io.FileOutputStream;
import java.io.IOException;

/**
 * @author :jerry
 * @date :Created in 2022/11/15 19:00
 * @description:PDF转word
 * @version: V1.1
 */
public class PdfWord {

  //测试
    public static void main(String[] args) throws IOException {
        pdfDoc("/Users/jerry/Downloads/考研背景知识盘点(政英数).pdf", ".DOCX");

    }
  
    //pdf转doc
    public static String pdfDoc(String pdfPath, String fileFormatValue) {
        String wordPath = pdfPath.substring(0, pdfPath.lastIndexOf(".")) + fileFormatValue;
        try {
            //新建一个word文档
            FileOutputStream os = new FileOutputStream(wordPath);
            //doc是将要被转化的word文档
            Document doc = new Document(pdfPath);
            //全面支持DOC, DOCX, OOXML, RTF HTML, OpenDocument, PDF, EPUB, XPS, SWF 相互转换
            doc.setPageInfo(new PageInfo());
            doc.save(os, getTypes(fileFormatValue));
            os.close();
            //转化用时

        } catch (Exception e) {
            System.out.println("Pdf 转 Word 失败...");
            e.printStackTrace();
        }
        return wordPath;
    }

    public static SaveFormat getTypes(String fileFormatValue) {
        SaveFormat docX = SaveFormat.DocX;
        switch (fileFormatValue) {
            //docX
            case ".DOCX":
                //黄金
                docX = SaveFormat.DocX;
                break;
            case ".PDF":
                //Pdf
                docX = SaveFormat.Pdf;
                break;
            case ".Html":
                //Html
                docX = SaveFormat.Html;
                break;
            case ".Xml":
                //Xml
                docX = SaveFormat.Xml;
                break;
            case ".XPS":
                //XPS
                docX = SaveFormat.Xps;
                break;
            case ".Excel":
                //Excel
                docX = SaveFormat.Excel;
                break;
            case ".svg":
                //Excel
                docX = SaveFormat.Svg;
                break;
            default:
                //普通会员
                docX = SaveFormat.Doc;
        }
        return docX;
    }
}

注意事项:

​ 1.有时候报错,可能是因为本机缺少相应的字体包,直接去字体网站 (https://cn.ffonts.net/)下载字体,放入本机的系统字体目录即可.

相关推荐
小离a_a16 分钟前
富文本内容展示A4纸张大小的内容,生成一个pdf的格式预览,预览内容上加两张图片,图片可拖拽,可下载到本地pdf
pdf
SYC_MORE1 小时前
无需 OCR,多模态大模型如何“读懂” PDF?——基于 GLM-4V-Flash 的智能文档解析原理剖析
人工智能·pdf·ocr
gc_22992 小时前
学习C#调用OpenXml操作word文档的基本用法(11:操作文档缩略图)
word·缩略图·openxml
m5655bj2 小时前
C# 在 PDF 文档中添加电子签名
开发语言·pdf·c#
野生技术架构师3 小时前
2025年Java面试八股文大全(附PDF版)
java·面试·pdf
私人珍藏库3 小时前
[Windows] PDF 专业电子签章工具 v4.8
windows·pdf
无敌的黑星星5 小时前
office 批量word转pdf
pdf·word·vba
CodeCraft Studio5 小时前
国产化Word处理控件Spire.Doc教程:使用C# 编程方式批量转换Word为RTF
开发语言·c#·word·spire.doc·word文档转换·word开发组件·word api库
console.log('npc')5 小时前
vue3文件上传弹窗,图片pdf,word,结合预览kkview
前端·javascript·vue.js·pdf·word
优选资源分享5 小时前
PDF to IMG v1.0:批量PDF转图片工具
pdf·实用工具