Python 文本转 PDF 完整指南:从字符串与 TXT 文件到专业 PDF 文档

目录

[为什么要将文本转换为 PDF?](#为什么要将文本转换为 PDF?)

[Python 文本转 PDF 的库选择](#Python 文本转 PDF 的库选择)

[使用 Python 将文本字符串转换为 PDF](#使用 Python 将文本字符串转换为 PDF)

[使用 Python 将 TXT 文本文件转换为 PDF](#使用 Python 将 TXT 文本文件转换为 PDF)

[文本转 PDF 时自定义页面布局,提升 PDF 输出效果](#文本转 PDF 时自定义页面布局,提升 PDF 输出效果)

[文本转 PDF 时添加页眉、页脚和页码,让 PDF 更专业](#文本转 PDF 时添加页眉、页脚和页码,让 PDF 更专业)

[使用 Python 批量将多个 TXT 文本文件转换为 PDF](#使用 Python 批量将多个 TXT 文本文件转换为 PDF)

总结


在 Python 开发过程中,将文本内容转换为 PDF 是一个非常常见、但又容易被忽视的需求。无论是生成系统报告、导出日志文件,还是将用户输入的内容整理成可分享的文档,单纯的 .txt 文本文件往往难以满足实际使用场景的要求。

相比之下,PDF 文件在排版稳定性、跨平台兼容性和专业呈现效果方面具有明显优势。它不仅可以在 Windows、macOS、Linux 以及移动设备上保持一致的显示效果,还支持页边距、字体样式、页眉页脚、页码等丰富的排版能力,非常适合用于正式文档、打印输出和长期存档。

本文将围绕一个高频且实用的开发场景,系统讲解如何使用 Python 将文本转换为 PDF 。内容不仅涵盖从文本字符串和 .txt 文件生成 PDF的基础方法,还将深入介绍页面布局自定义、添加页眉页脚与页码,以及如何批量处理多个文本文件,帮助你构建稳定、自动化的文档生成流程。

无论你是希望快速生成一份简单的 PDF,还是需要在项目中实现专业级的文本转 PDF 解决方案,本文都能为你提供清晰的思路和可直接使用的代码示例。

本文将涵盖的内容

  • 为什么要将文本转换为 PDF

  • Python 文本转 PDF 的库选择

  • 使用 Python 将文本字符串转换为 PDF

  • 使用 Python 将 TXT 文本文件转换为 PDF

  • 文本转 PDF 时自定义页面布局,提升 PDF 输出效果

  • 文本转 PDF 时添加页眉、页脚和页码,让 PDF 更专业

  • 使用 Python 批量将多个文本文件转换为 PDF

为什么要将文本转换为 PDF?

在很多项目中,文本内容最初往往以字符串或 .txt 文件的形式存在。但当这些内容需要对外分享、打印或长期保存时,PDF 通常是更合适的选择,原因主要包括以下几点:

1. 跨平台显示一致

PDF 文件在不同操作系统和设备上的显示效果高度一致,不会出现字体错乱或排版变化的问题,有助于保证用户体验的稳定性。

2. 更专业的文档呈现

与纯文本文件相比,PDF 支持字体、字号、段落间距和页面布局设置,生成的文档更规范、更易读,更符合正式文档的使用场景。

3. 适合长期存档

PDF 是广泛认可的标准文档格式,支持压缩、加密和数字签名,非常适合用于档案保存和合规场景。

4. 打印效果可靠

无论使用哪种打印设备,PDF 的页面布局都能保持一致,非常适合用于报告、合同和正式文件输出。

Python 文本转 PDF 的库选择

在 Python 中,实现文本转 PDF 有多种方式,但在实际开发中,开发者通常希望:

  • 使用方式简单,学习成本低

  • 支持字体、页面布局等格式控制

  • 不依赖 Microsoft Word 等外部环境

  • 适合自动化脚本和批量处理

Spire.Doc for Python 是满足这些需求的一种解决方案。它可以直接将文本字符串或 .txt 文件转换为 PDF,并支持对页面布局、字体样式、页眉页脚等进行精细控制,全程无需安装 Office 软件,非常适合服务器环境和自动化任务。

安装所需库

可以通过 pip 从 PyPI 安装该库:

python 复制代码
pip install spire-doc

安装完成后,即可在 Python 脚本中导入并使用。

使用 Python 将文本字符串转换为 PDF

在实际开发中,经常需要将动态生成的文本内容直接转换为 PDF,例如表单数据、接口返回结果或系统生成的说明信息。

实现思路

  1. 创建 Document 文档对象

  2. 向文档中添加一个节(Section)

  3. 在节中添加段落

  4. 向段落中插入文本并设置字体样式

  5. 将文档保存为 PDF

示例代码

python 复制代码
from spire.doc import *

# 创建新的文档对象
document = Document()

# 添加一个节
section = document.AddSection()

# 设置页面边距(单位:磅)
section.PageSetup.Margins.All = 72

# 添加段落
paragraph = section.AddParagraph()

# 向段落中插入中文文本
text_range = paragraph.AppendText(
    "这是一个使用 Python 将文本字符串转换为 PDF 的示例文档。"
)

# 设置中文字体和样式
text_range.CharacterFormat.FontName = "微软雅黑"
text_range.CharacterFormat.FontSize = 14

# 保存为 PDF 文件
document.SaveToFile("文本字符串转PDF示例.pdf", FileFormat.PDF)

# 关闭文档,释放资源
document.Close()

使用 Python 将 TXT 文本文件转换为 PDF

如果你已经有现成的 . txt 文件,例如系统日志、导出的数据文本或简单报告,可以直接加载并转换为 PDF,而无需逐行手动处理文本内容。

实现步骤

  1. 创建 Document 文档对象

  2. 加载txt文件内容

  3. 保存为 PDF 文件

示例代码

python 复制代码
from spire.doc import *

# 创建文档对象
document = Document()

# 加载 TXT 文件
document.LoadFromFile("示例文本.txt", FileFormat.Txt)

# 保存为 PDF
document.SaveToFile("TXT转PDF示例.pdf", FileFormat.PDF)

# 关闭文档
document.Close()

文本转 PDF 时自定义页面布局,提升 PDF 输出效果

默认生成的 PDF 使用纵向页面和标准页边距。在实际应用中,如果文档内容较多、行宽较大或用于横向展示(如表格、日志),可以通过自定义页面布局来提升阅读体验。

常见可调整页面布局

  • 页面大小(A4、Letter 等)

  • 页面方向(纵向 / 横向)

  • 页边距(上下左右)

示例代码

python 复制代码
from spire.doc import *

# 创建文档
document = Document()

# 添加节
section = document.AddSection()

# 设置页面大小为 A4,横向显示
section.PageSetup.PageSize = PageSize.A4()
section.PageSetup.Orientation = PageOrientation.Landscape

# 设置页边距
section.PageSetup.Margins.Top = 50
section.PageSetup.Margins.Bottom = 50
section.PageSetup.Margins.Left = 60
section.PageSetup.Margins.Right = 60

# 添加正文内容
paragraph = section.AddParagraph()
paragraph.AppendText(
    "本示例展示了如何自定义 PDF 的页面大小、方向和页边距,"
    "以获得更好的排版效果。"
).CharacterFormat.FontName = "微软雅黑"

# 保存为 PDF
document.SaveToFile("自定义页面布局示例.pdf", FileFormat.PDF)

# 关闭文档
document.Close()

文本转 PDF 时添加页眉、页脚和页码,让 PDF 更专业

在正式文档(如报告、对外材料、打印文件)中,页眉、页脚和页码几乎是必不可少的组成部分。

通过在生成 PDF 时自动添加这些元素,可以显著提升文档的专业度和可读性。

下面的示例展示了如何:

  • 在页眉中添加中文标题

  • 在页脚中插入自动页码(当前页 / 总页数)

  • 同时插入正文内容

示例代码

python 复制代码
from spire.doc import *

# 创建文档
document = Document()

# 添加节
section = document.AddSection()
section.PageSetup.Margins.All = 40

# ===== 添加页眉 =====
header = section.HeadersFooters.Header
header_paragraph = header.AddParagraph()

header_text = header_paragraph.AppendText("季度销售数据分析报告")
header_text.CharacterFormat.FontName = "微软雅黑"
header_text.CharacterFormat.FontSize = 11
header_text.CharacterFormat.Italic = True

header_paragraph.Format.HorizontalAlignment = HorizontalAlignment.Right

# ===== 添加页脚和页码 =====
footer = section.HeadersFooters.Footer
footer_paragraph = footer.AddParagraph()
footer_paragraph.Format.HorizontalAlignment = HorizontalAlignment.Center

footer_paragraph.AppendText("第 ")
footer_paragraph.AppendField("页码", FieldType.FieldPage)
footer_paragraph.AppendText(" 页 / 共 ")
footer_paragraph.AppendField("总页数", FieldType.FieldNumPages)
footer_paragraph.AppendText(" 页")

# ===== 添加正文 =====
content = section.AddParagraph()
content.AppendText(
    "本 PDF 文档由 Python 自动生成,包含页眉、页脚和页码,"
    "适用于正式报告和打印输出。"
).CharacterFormat.FontName = "微软雅黑"

# 保存为 PDF
document.SaveToFile("带页眉页脚的PDF示例.pdf", FileFormat.PDF)

# 关闭文档
document.Close()

使用 Python 批量将多个 TXT 文本文件转换为 PDF

在真实业务场景中,文本转 PDF 往往不是处理单个文件,而是需要面对大量日志、批量报表或定期生成的文本数据。

此时,通过 Python 进行批量转换可以显著提高效率,并减少人工操作带来的风险。

示例代码

python 复制代码
import os
from spire.doc import *

# 输入目录:存放 TXT 文件
input_folder = "text_files"

# 输出目录:存放生成的 PDF 文件
output_folder = "pdf_files"

# 如果输出目录不存在,则创建
os.makedirs(output_folder, exist_ok=True)

# 遍历输入目录中的所有文件
for filename in os.listdir(input_folder):

    # 仅处理 .txt 文件
    if filename.endswith(".txt"):
        try:
            # 创建文档对象
            document = Document()

            # 构建输入文件路径
            input_path = os.path.join(input_folder, filename)

            # 加载 TXT 文件
            document.LoadFromFile(input_path, FileFormat.Txt)

            # 构建输出 PDF 路径
            output_path = os.path.join(
                output_folder,
                filename.replace(".txt", ".pdf")
            )

            # 保存为 PDF
            document.SaveToFile(output_path, FileFormat.PDF)

            # 关闭文档
            document.Close()

            print(f"转换成功:{filename} → {output_path}")

        except Exception as e:
            print(f"转换失败:{filename},错误信息:{e}")

总结

在 Python 中将文本转换为 PDF 不仅实现简单,而且具备很强的实用性和扩展性。无论是从字符串生成 PDF、将 TXT 文件转换为 PDF,还是批量处理多个文本文件,你都可以灵活控制页面布局、字体样式以及页眉页脚等专业元素。

通过本文介绍的方法,你可以快速构建一套稳定、高效、可自动化的文本转 PDF 解决方案,轻松生成适合分享、打印和长期存档的高质量 PDF 文档。

相关推荐
小陈工42 分钟前
Python Web开发入门(十七):Vue.js与Python后端集成——让前后端真正“握手言和“
开发语言·前端·javascript·数据库·vue.js·人工智能·python
A__tao5 小时前
Elasticsearch Mapping 一键生成 Java 实体类(支持嵌套 + 自动过滤注释)
java·python·elasticsearch
研究点啥好呢5 小时前
Github热门项目推荐 | 创建你的像素风格!
c++·python·node.js·github·开源软件
迷藏4945 小时前
**发散创新:基于Rust实现的开源合规权限管理框架设计与实践**在现代软件架构中,**权限控制(RBAC)** 已成为保障
java·开发语言·python·rust·开源
明日清晨6 小时前
python扫码登录dy
开发语言·python
bazhange6 小时前
python如何像matlab一样使用向量化替代for循环
开发语言·python·matlab
人工干智能6 小时前
科普:python中你写的模块找不到了——`ModuleNotFoundError`
服务器·python
unicrom_深圳市由你创科技6 小时前
做虚拟示波器这种实时波形显示的上位机,用什么语言?
c++·python·c#
小敬爱吃饭6 小时前
Ragflow Docker部署及问题解决方案(界面为Welcome to nginx,ragflow上传文件失败,Docker中的ragflow-cpu-1一直重启)
人工智能·python·nginx·docker·语言模型·容器·数据挖掘
宸津-代码粉碎机6 小时前
Spring Boot 4.0虚拟线程实战调优技巧,最大化发挥并发优势
java·人工智能·spring boot·后端·python