将CHM文件转换为PDF格式,直接使用纯Java处理非常复杂(涉及CHM容器解析、HTML渲染及PDF生成)。更可行的方案是借助成熟的命令行工具,如 Calibre 中的 ebook-convert,然后在Java中调用该外部命令。
以下是一个完整的Java工具类,实现了调用 ebook-convert 将CHM转为PDF的功能。
java
import java.io.BufferedReader;import java.io.File;import java.io.IOException;import java.io.InputStreamReader;import java.util.ArrayList;import java.util.List;/** * CHM转PDF工具(依赖 Calibre 的 ebook-convert 命令) * 使用前请确保已经安装 Calibre 并已将 ebook-convert 添加到系统 PATH 中 * 或者在本代码中指定其绝对路径 */public class ChmToPdfConverter { /** * 执行转换 * @param chmFilePath 输入的CHM文件路径 * @param pdfFilePath 输出的PDF文件路径 * @return 转换是否成功 */ public static boolean convert(String chmFilePath, String pdfFilePath) { // 校验输入文件 File chmFile = new File(chmFilePath); if (!chmFile.exists() || !chmFile.isFile()) { System.err.println("CHM文件不存在: " + chmFilePath); return false; } // 确保输出目录存在 File pdfFile = new File(pdfFilePath); File parentDir = pdfFile.getParentFile(); if (parentDir != null && !parentDir.exists()) { if (!parentDir.mkdirs()) { System.err.println("无法创建输出目录: " + parentDir.getAbsolutePath()); return false; } } // 构建命令行参数 List<String> command = new ArrayList<>(); // 如果 ebook-convert 不在 PATH 中,可以写绝对路径,例如: // command.add("/usr/local/bin/ebook-convert"); // Linux/Mac // command.add("C:\\Program Files\\Calibre2\\ebook-convert.exe"); // Windows command.add("ebook-convert"); command.add(chmFilePath); command.add(pdfFilePath); // 可选参数:设置输出PDF的纸张大小、页边距等(根据需求添加) // command.add("--paper-size"); command.add("a4"); // command.add("--pdf-page-numbers"); command.add("--base-font-size"); command.add("12"); ProcessBuilder pb = new ProcessBuilder(command); pb.redirectErrorStream(true); // 合并错误流和输出流 try { Process process = pb.start(); // 读取命令输出(防止缓冲区阻塞) try (BufferedReader reader = new BufferedReader(new InputStreamReader(process.getInputStream()))) { String line; while ((line = reader.readLine()) != null) { System.out.println("[ebook-convert] " + line); } } int exitCode = process.waitFor(); if (exitCode == 0) { System.out.println("转换成功,PDF文件保存至: " + pdfFilePath); return true; } else { System.err.println("转换失败,退出码: " + exitCode); return false; } } catch (IOException | InterruptedException e) { e.printStackTrace(); return false; } } // 测试示例 public static void main(String[] args) { String chmPath = "C:/docs/help.chm"; // 替换为你的CHM路径 String pdfPath = "C:/docs/output.pdf"; // 输出PDF路径 boolean success = convert(chmPath, pdfPath); if (!success) { System.err.println("转换失败,请检查:1)Calibre是否已安装;2)ebook-convert是否在PATH中;3)输入文件路径是否正确。"); } }}
使用说明1. 安装 Calibre 访问 https://calibre-ebook.com/download,根据操作系统下载安装。安装时勾选"将Calibre添加到系统PATH",或安装后手动将`ebook-convert`所在目录加入环境变量。 · Windows 默认路径:C:\Program Files\Calibre2\ · Linux 通常位于:/usr/bin/ebook-convert · macOS 通常位于:/Applications/calibre.app/Contents/MacOS/ebook-convert2. 运行Java代码 修改 main 方法中的输入输出路径,执行即可。若未配置PATH,可在代码的command.add中填写ebook-convert的完整绝对路径。3. 可选参数 命令行可追加 --paper-size a4、--base-font-size 12 等控制PDF样式,具体参考 Calibre用户手册。纯Java方案简述(不推荐)如果必须不用外部命令,可以考虑:· 使用 Apache Tika 提取CHM中的文本(会丢失图片、表格和排版);· 用 jCHM 或 chm4j 等老旧库解析CHM得到原始HTML文件集;· 使用 Flying Saucer 或 OpenHTMLtoPDF 将HTML转换为PDF(对复杂CSS支持差,且难以处理超链接、图片路径)。这样做开发成本极高,且效果远不如Calibre专业。因此,调用ebook-convert是工业上可靠、经济的做法。