PDF转换Word

PDF 转换Wrod 最强脚本

1.整个文件转化
python 复制代码
from pdf2docx import Converter

def pdf_to_word_full(pdf_path, word_path):
    cv = Converter(pdf_path)
    # 执行转换(默认保留所有页面,样式自动还原)
    cv.convert(word_path, start=0, end=None)
    cv.close()


if __name__ == "__main__":
 
    PDF_FILE = "C:/upload/1229/美的年报.pdf"  
    WORD_FILE = "C:/upload/pdf2word/美的年报.docx" 
    pdf_to_word_full(PDF_FILE, WORD_FILE)
    print(f"转换完成!Word文件已保存至:{WORD_FILE}")
2 指定部分页数转化
python 复制代码
from pdf2docx import Converter

def pdf_to_word_partial(pdf_path, word_path, start_page, end_page=None):
    cv = Converter(pdf_path)
    # 指定页码范围转换,保留原样式
    cv.convert(word_path, start=start_page, end=end_page)
    cv.close()

if __name__ == "__main__":
    PDF_FILE = "C:/upload/1229/美的年报.pdf"  
    WORD_FILE = "C:/upload/pdf2word/美的年报2.docx" 
    pdf_to_word_partial(PDF_FILE, WORD_FILE, start_page=0, end_page=2)
    print(f"指定页码转换完成!Word文件已保存至:{WORD_FILE}")
相关推荐
强化试剂9 小时前
荧光标记利器 Alkyne-PEG-FITC;FITC-PEG-Alkyne:核心优势与行业价值
python·flask·pyqt·scipy
电商API&Tina9 小时前
电商数据采集 API:驱动选品、定价、运营的数据分析核心引擎
大数据·开发语言·人工智能·python·数据分析·json
zgl_200537799 小时前
ZGLanguage 解析SQL数据血缘 之 Python提取SQL表级血缘树信息
大数据·数据库·数据仓库·hive·hadoop·python·sql
rgeshfgreh10 小时前
Python函数全解析:定义、参数与作用域
前端·数据库·python
Cigaretter710 小时前
Day 40 图像数据与显存
python
一只大侠的侠10 小时前
Python实现TTAO算法:优化神经网络中的时序预测任务
python·神经网络·算法
予枫的编程笔记10 小时前
【论文解读】DMD:解耦多模态蒸馏,开启情感识别新范式 (CVPR 2023)
人工智能·python·情感计算
百锦再10 小时前
AI视频生成模型从无到有:构建、实现与调试完全指南
人工智能·python·ai·小程序·aigc·音视频·notepad++