Java使用pdfbox将pdf转图片

前言

目前比较主流的两种转pdf的方式,就是pdfbox和icepdf,两种我都尝试了下,icepdf解析出来有时候会出现中文显示不出来,网上的解决方式又特别麻烦,不是安装字体,就是重写底层类,所以我选择了pdfbox

添加依赖

XML 复制代码
<dependency>
	<groupId>org.apache.pdfbox</groupId>
	<artifactId>pdfbox</artifactId>
	<version>3.0.0</version>
</dependency>

代码

java 复制代码
import org.apache.pdfbox.Loader;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.rendering.PDFRenderer;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;
import java.nio.file.Files;
import java.nio.file.Paths;

public class Main {
	public static void main(String[] args) throws Exception {
		// 加载pdf文件
		PDDocument doc = Loader.loadPDF(new File("data.pdf"));
		// 2.x版本的pdfbox写法
		// PDDocument doc = PDDocument.load(new File("data.pdf"));
		PDFRenderer renderer = new PDFRenderer(doc);
		// 遍历每页pdf
		for (int i = 0; i < doc.getNumberOfPages(); i++) {
			// dpi调到300左右即可,太小会模糊,太大会使图片变得很大
			BufferedImage image = renderer.renderImageWithDPI(i, 300);
			ImageIO.write(image, "jpg", Files.newOutputStream(Paths.get("data_" + i + ".jpg")));
		}
	}
}

在arm架构的linux上转换可能会出现模糊情况

在windows上好好的,x86_64的linux上也好好的,就是arm架构的linux上会出现

网上的博客基本上不是安装字体,就是重写底层类,但你永远不会想到是jdk的问题

解决办法:jdk8以上版本的jdk,或者使用高版本的jdk8,不能低于8u311即可

转换效果如下:

附上高版本的jdk8下载地址:https://www.oracle.com/java/technologies/downloads/#java8

相关推荐
TeamDev1 分钟前
JxBrowser 8.18.2 版本发布啦!
java·前端·跨平台·桌面应用·web ui·jxbrowser·浏览器控件
晴天sir5 分钟前
Redis 在业务中的几种典型用法
java·数据库·redis
WJX_KOI10 分钟前
MemOS —— 为大语言模型 (LLMs) 和智能体打造的记忆操作系统。
java·人工智能·语言模型
_日拱一卒15 分钟前
LeetCode:矩阵置零
java·数据结构·线性代数·算法·leetcode·职场和发展·矩阵
weixin_4080996718 分钟前
【实战教程】懒人精灵如何实现 OCR 文字识别?接口调用完整指南(附可运行示例)
java·前端·人工智能·后端·ocr·api·懒人精灵
花千树-01035 分钟前
Java Agent 集成 MCP 工具协议:让 AI 真正驱动企业系统
java·ai·langchain·ai agent·mcp·harness·j-langchain
橘子编程40 分钟前
GoF 23 种设计模式完整知识总结与使用教程
java·c语言·开发语言·python·设计模式
君以思为故1 小时前
认识Linux -- 线程同步与互斥
java·开发语言
被摘下的星星1 小时前
Java接口需要注意的细节
java·开发语言
培风图南以星河揽胜1 小时前
幻想简历!博主本人期望的 AI Agent 全栈简历:Java + Python + Vue3 跨语言实战,代码已开源!
java·人工智能·python