零代码编程:用ChatGPT多线程批量将PDF文档转换为word格式

pdf2docx是Python的一个库,可以很方便的将PDF文档转换为word格式,首先安装这个库。

然后在ChatGPT中输入提示词:

你是一个Python编程专家,要完成一个文档格式转换的任务,具体步骤如下:

打开F盘的Books文件夹;

读取里面的PDF文档,用pdf2docx库将其转换为word文档;

注意:每一步都要输出相关信息

使用多线程以加快转换速度;

源代码如下:

import os

from glob import glob

from pdf2docx import Converter

from concurrent.futures import ThreadPoolExecutor, as_completed

定义PDF转Word的函数

def pdf_to_word(pdf_file):

创建输出的Word文件名

docx_file = pdf_file.rsplit('.', 1)[0] + '.docx'

创建一个转换器对象

cv = Converter(pdf_file)

将PDF转换为Word

cv.convert(docx_file, start=0, end=None)

cv.close()

print(f'Successfully converted {pdf_file} to {docx_file}.')

获取F盘Books文件夹下的所有PDF文件

pdf_files = glob('F:/Books/*.pdf')

创建一个线程池

with ThreadPoolExecutor(max_workers=5) as executor:

使用线程池中的线程来执行转换任务

futures = {executor.submit(pdf_to_word, pdf_file): pdf_file for pdf_file in pdf_files}

打印转换进度

for future in as_completed(futures):

pdf_file = futures[future]

print(f'Finished processing file: {pdf_file}')

运行成功:

图片和表格都成功转换了:

相关推荐
希忘auto3 天前
详解Redis的常用命令
redis·1024程序员节
yaosheng_VALVE3 天前
探究全金属硬密封蝶阀的奥秘-耀圣控制
运维·eclipse·自动化·pyqt·1024程序员节
dami_king3 天前
SSH特性|组成|SSH是什么?
运维·ssh·1024程序员节
一个通信老学姐8 天前
专业125+总分400+南京理工大学818考研经验南理工电子信息与通信工程,真题,大纲,参考书。
考研·信息与通信·信号处理·1024程序员节
sheng12345678rui8 天前
mfc140.dll文件缺失的修复方法分享,全面分析mfc140.dll的几种解决方法
游戏·电脑·dll文件·dll修复工具·1024程序员节
huipeng9269 天前
第十章 类和对象(二)
java·开发语言·学习·1024程序员节
earthzhang20219 天前
《深入浅出HTTPS》读书笔记(19):密钥
开发语言·网络协议·算法·https·1024程序员节
爱吃生蚝的于勒10 天前
计算机基础 原码反码补码问题
经验分享·笔记·计算机网络·其他·1024程序员节
earthzhang202110 天前
《深入浅出HTTPS》读书笔记(20):口令和PEB算法
开发语言·网络协议·算法·https·1024程序员节
一个通信老学姐10 天前
专业140+总分410+浙江大学842信号系统与数字电路考研经验浙大电子信息与通信工程,真题,大纲,参考书。
考研·信息与通信·信号处理·1024程序员节