python如何word转pdf

在Python中,将Word文档(.docx.doc)转换为PDF可以通过多种库实现。以下是几种常见的方法及详细步骤:


方法1:使用 python-docx + comtypes(仅Windows,需安装Word)

适用于Windows系统,依赖本地安装的Microsoft Word。

python 复制代码
import comtypes.client

def docx_to_pdf(input_path, output_path):
    word = comtypes.client.CreateObject("Word.Application")
    doc = word.Documents.Open(input_path)
    doc.SaveAs(output_path, FileFormat=17)  # 17是PDF格式的代码
    doc.Close()
    word.Quit()

# 示例
docx_to_pdf("input.docx", "output.pdf")

注意

  • 仅支持Windows且需安装Microsoft Word。
  • 需安装comtypes库:pip install comtypes

方法2:使用 docx2pdf(跨平台,推荐)

基于libreofficeunoconv的封装,支持跨平台(Windows/macOS/Linux)。

python 复制代码
from docx2pdf import convert

# 单文件转换
convert("input.docx", "output.pdf")

# 批量转换整个文件夹
convert("input_folder/", "output_folder/")

安装

bash 复制代码
pip install docx2pdf

依赖

  • Windows:需安装Microsoft Word或LibreOffice。
  • macOS/Linux:需安装LibreOffice(sudo apt install libreoffice)。

方法3:使用 pywin32(仅Windows,类似comtypes

comtypes类似,但使用pywin32库。

python 复制代码
import win32com.client

def docx_to_pdf(input_path, output_path):
    word = win32com.client.Dispatch("Word.Application")
    doc = word.Documents.Open(input_path)
    doc.SaveAs(output_path, FileFormat=17)
    doc.Close()
    word.Quit()

# 示例
docx_to_pdf("input.docx", "output.pdf")

安装

bash 复制代码
pip install pywin32

方法4:使用 unoconv(Linux优先)

依赖LibreOffice的命令行工具unoconv

python 复制代码
import subprocess

def docx_to_pdf(input_path, output_path):
    subprocess.run(["unoconv", "-f", "pdf", "-o", output_path, input_path])

# 示例
docx_to_pdf("input.docx", "output.pdf")

安装

bash 复制代码
# Linux
sudo apt install unoconv
# macOS
brew install unoconv

方法5:使用 Aspose.Words(付费库,功能强大)

适用于企业级应用,支持高级格式转换。

python 复制代码
import asposewords as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

安装

bash 复制代码
pip install aspose-words

注意事项

  1. 跨平台兼容性
    • 推荐docx2pdf(需LibreOffice)或python-docx+comtypes(仅Windows)。
  2. 格式保真
    • 复杂格式(如表格、图表)建议使用docx2pdfAspose.Words
  3. 无头模式
    • Linux服务器可配置LibreOffice的无头模式:

      bash 复制代码
      libreoffice --headless --convert-to pdf *.docx

完整示例(推荐docx2pdf

python 复制代码
from docx2pdf import convert

def convert_word_to_pdf(input_file, output_file):
    try:
        convert(input_file, output_file)
        print(f"转换成功:{output_file}")
    except Exception as e:
        print(f"转换失败:{e}")

# 使用示例
convert_word_to_pdf("report.docx", "report.pdf")

选择方法时,请根据操作系统、依赖环境和需求(如批量转换、格式复杂度)决定。

相关推荐
BYSJMG29 分钟前
计算机大数据毕业设计推荐:基于Spark的气候疾病传播可视化分析系统【Hadoop、python、spark】
大数据·hadoop·python·信息可视化·spark·django·课程设计
抠头专注python环境配置2 小时前
OCR库pytesseract安装保姆级教程
python·ocr·conda
山烛2 小时前
矿物分类系统开发笔记(二):模型训练[删除空缺行]
人工智能·笔记·python·机器学习·分类·数据挖掘
大得3692 小时前
django生成迁移文件,执行生成到数据库
后端·python·django
大志说编程2 小时前
LangChain框架入门17: 手把手教你创建LLM工具
python·langchain·ai编程
R-G-B3 小时前
【P38 6】OpenCV Python——图片的运算(算术运算、逻辑运算)加法add、subtract减法、乘法multiply、除法divide
人工智能·python·opencv·图片的运算·图片加法add·图片subtract减法·图片乘法multiply
数据智能老司机3 小时前
MCP 实战——全局视角:为什么 MCP 将成为 AI 的颠覆者
python·llm·mcp
在星空下3 小时前
Fastapi-Vue3-Admin
前端·python·fastapi
cxyll12343 小时前
从接口自动化测试框架设计到开发(三)主流程封装、返回数据写入excel
前端·python·excel
Kyln.Wu3 小时前
【python实用小脚本-190】Python一键删除PDF任意页:输入页码秒出干净文件——再也不用在线裁剪排队
服务器·python·pdf