零代码编程:用ChatGPT多线程批量将PDF文档转换为word格式

pdf2docx是Python的一个库,可以很方便的将PDF文档转换为word格式,首先安装这个库。

然后在ChatGPT中输入提示词:

你是一个Python编程专家,要完成一个文档格式转换的任务,具体步骤如下:

打开F盘的Books文件夹;

读取里面的PDF文档,用pdf2docx库将其转换为word文档;

注意:每一步都要输出相关信息

使用多线程以加快转换速度;

源代码如下:

import os

from glob import glob

from pdf2docx import Converter

from concurrent.futures import ThreadPoolExecutor, as_completed

定义PDF转Word的函数

def pdf_to_word(pdf_file):

创建输出的Word文件名

docx_file = pdf_file.rsplit('.', 1)[0] + '.docx'

创建一个转换器对象

cv = Converter(pdf_file)

将PDF转换为Word

cv.convert(docx_file, start=0, end=None)

cv.close()

print(f'Successfully converted {pdf_file} to {docx_file}.')

获取F盘Books文件夹下的所有PDF文件

pdf_files = glob('F:/Books/*.pdf')

创建一个线程池

with ThreadPoolExecutor(max_workers=5) as executor:

使用线程池中的线程来执行转换任务

futures = {executor.submit(pdf_to_word, pdf_file): pdf_file for pdf_file in pdf_files}

打印转换进度

for future in as_completed(futures):

pdf_file = futures[future]

print(f'Finished processing file: {pdf_file}')

运行成功:

图片和表格都成功转换了:

相关推荐
yaosheng_VALVE16 分钟前
稀硫酸介质中 V 型球阀的材质选择与选型要点-耀圣
运维·spring cloud·自动化·intellij-idea·材质·1024程序员节
网安_秋刀鱼3 小时前
java组件安全
web安全·网络安全·1024程序员节
earthzhang20213 小时前
《深入浅出HTTPS》读书笔记(7):安全的密码学Hash算法
网络·网络协议·http·https·1024程序员节
程序员小海绵【vincewm】6 小时前
【设计模式】结合Tomcat源码,分析外观模式/门面模式的特性和应用场景
设计模式·tomcat·源码·外观模式·1024程序员节·门面模式
一个通信老学姐7 小时前
专业140+总分410+东北大学841考研经验东大电子信息与通信工程通信专业基础真题,大纲,参考书
考研·信息与通信·信号处理·1024程序员节
惜.己7 小时前
Jmeter中的监听器(一)
测试工具·jmeter·1024程序员节
纪伊路上盛名在8 小时前
AI制作ppt
1024程序员节
爱搞技术的猫猫9 小时前
实现API接口的自动化
大数据·运维·数据库·性能优化·自动化·产品经理·1024程序员节
FFDUST1 天前
C++ 优先算法 —— 四数之和(双指针)
c语言·开发语言·c++·算法·leetcode·1024程序员节
惜.己1 天前
Jmeter中的配置原件(三)
功能测试·测试工具·jmeter·1024程序员节