【工具类】PDF文件转图片

PDF文件转文件

1. 引入Maven依赖

主要使用了 pdfbox 包与 hutool 包。

pdfbox 负责 pdf 到图片的转换;

hutool 负责文件读取转换。

xml 复制代码
<dependency>
	<groupId>org.apache.pdfbox</groupId>
	<artifactId>pdfbox</artifactId>
	<version>2.0.27</version>
</dependency>
<dependency>
	<groupId>cn.hutool</groupId>
	<artifactId>hutool-all</artifactId>
	<version>5.8.34</version>
</dependency>
2. 代码实现

主要思路:

pdfbox 提供了操作输入流与操作字节数组的两种方式。

2.1 字节数组
java 复制代码
public void pdf2Image() {
	// 这边简单采用读取本地文件的形式
    File file = new File("");
    File outFile = new File("");
    byte[] bytes = FileUtil.readBytes(file);

    String formatName = "png";

    try (PDDocument document = PDDocument.load(bytes)) {
        PDFRenderer pdfRenderer = new PDFRenderer(document);
        int numberOfPages = document.getNumberOfPages();

        // 将 BufferedImage 转换为字节数组
        ByteArrayOutputStream baos = new ByteArrayOutputStream();
        for (int i = 0; i < numberOfPages; i++) {
            // 渲染第一页为 BufferedImage
            BufferedImage bufferedImage = pdfRenderer.renderImageWithDPI(0, 50);
            ImgUtil.write(bufferedImage, formatName, baos);
        }

        OutputStream outputStream = new FileOutputStream(outFile);
        baos.writeTo(outputStream);
    } catch (Exception e) {
        e.printStackTrace();
    }
}

通过字节数组可实现 pdf 文件转换为图片,但是这个代码在处理大文件时会一次性把文件读进内存导致内存溢出

2.2 文件流
java 复制代码
public void pdf2Image() {
    File file = new File("");
    File outFile = new File("");
    String formatName = "png";

    try (InputStream is = new BufferedInputStream(new FileInputStream(file))) {
        PDDocument document = PDDocument.load(is, MemoryUsageSetting.setupTempFileOnly());
        PDFRenderer pdfRenderer = new PDFRenderer(document);
        int numberOfPages = document.getNumberOfPages();

        // 将 BufferedImage 转换为字节数组
        ByteArrayOutputStream baos = new ByteArrayOutputStream();
        for (int i = 0; i < numberOfPages; i++) {
            // 渲染第一页为 BufferedImage
            BufferedImage bufferedImage = pdfRenderer.renderImageWithDPI(0, 50);
            ImgUtil.write(bufferedImage, formatName, baos);
        }

        OutputStream outputStream = new FileOutputStream(outFile);
        baos.writeTo(outputStream);
    } catch (Exception e) {
        e.printStackTrace();
    }
}
相关推荐
半部论语12 小时前
MyBatis-Plus 通用 CRUD 实现原理技术文档
java·spring boot·mybatis
手握风云-12 小时前
JavaEE 进阶第六期:Spring Boot 如何重塑后端开发
java·spring boot·java-ee
Deamon Tree12 小时前
【设计题】如何实现一个线程安全的缓存?
java·spring boot·spring
毕设源码-钟学长12 小时前
【开题答辩全过程】以 基于Java的相机专卖网的设计与实现为例,包含答辩的问题和答案
java·开发语言
CodeAmaz12 小时前
Zookeeper 分布式锁实战版
java·分布式·后端·zookeeper
海域云SeaArea_12 小时前
CentOS7 单机安装 Zookeeper 3.5.8(JDK 1.8 环境)
java·zookeeper·java-zookeeper
后端小张13 小时前
【JAVA 进阶】SpringAI人工智能框架深度解析:从理论到实战的企业级AI应用开发指南
java·开发语言·人工智能
麦烤楽鸡翅13 小时前
小红书推荐系统(牛客)
java·python·算法·秋招·春招·牛客·面试算法题
C++业余爱好者13 小时前
.NET线程池ThreadPool.QueueUserWorkItem
java·数据库·.net
.豆鲨包13 小时前
【Android】Android内存缓存LruCache与DiskLruCache的使用及实现原理
android·java·缓存