txt数据转为pdf格式并使用base64解密输出

使用该方法请注意:因为此方法使用了base64解密,需要保证txt中的数据首先用了base64加密,如果只是普通的二进制数据,该方法并不适用

第一步

XML 复制代码
 <dependency>
        <groupId>org.apache.pdfbox</groupId>
        <artifactId>pdfbox</artifactId>
        <version>2.0.24</version>
</dependency>

第二步

java 复制代码
package org.example.test.example.changefile;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;

import java.io.ByteArrayInputStream;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;

public class ParsePDFFromString {
    public static void main(String[] args) {
        // 输入txt文件的路径
        String txtFilePath = "C:\\Users\\EDY\\Desktop\\input.txt";
        // 输出PDF文件的路径
        String outputPdfPath = "C:\\Users\\EDY\\Desktop\\output.pdf";

        try {
            // 读取txt文件内容
            String base64Data = new String(Files.readAllBytes(Paths.get(txtFilePath))).trim();

            // 检查Base64数据是否为空
            if (base64Data.isEmpty()) {
                System.out.println("Base64 data is empty.");
                return;
            }

            // Base64解码
            byte[] pdfBytes = java.util.Base64.getDecoder().decode(base64Data);

            // 检查解码后的数据是否为空
            if (pdfBytes.length == 0) {
                System.out.println("Decoded PDF data is empty.");
                return;
            }

            // 将解码后的数据转换为PDF文件
            try (PDDocument document = PDDocument.load(new ByteArrayInputStream(pdfBytes))) {
                // 创建PDFTextStripper对象
                PDFTextStripper stripper = new PDFTextStripper();

                // 从PDF文档中提取文本
                String text = stripper.getText(document);

                // 输出提取的文本
                System.out.println(text);

                // 保存PDF文档
                document.save(outputPdfPath);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}
相关推荐
白鲸开源11 小时前
Apache SeaTunnel Zeta Engine 的 Basic Auth 是怎么工作的?
java·vue.js·github
白鲸开源11 小时前
一文读懂DolphinScheduler插件机制:如何轻松扩展任务类型与数据源
java·架构·github
用户2986985301416 小时前
Java 实现 Word 文档文本查找与高亮标注
java·后端
宇宙之一粟17 小时前
乐企版式文件生成平台
java·后端·python
plainGeekDev17 小时前
MVC 写法 → MVVM
android·java·kotlin
SL_staff18 小时前
3周搭完MES系统:JVS低代码+JVS-IoT物联网的实战记录
java·前端·低代码
MacroZheng18 小时前
斩获20w star!Claude Code最强插件,AI编程必备!
java·人工智能·后端
唐青枫19 小时前
Java Spring WebFlux 实战指南:用 Mono、Flux 和 WebClient 写响应式接口
java·spring
小bo波1 天前
使用Thread子类创建线程 VS 使用Runnable接口创建线程的区别
java·多线程·thread·并发编程·runnable
SamDeepThinking1 天前
高并发场景下,CompletableFuture与ForkJoinPool该如何取舍?
java·后端·面试