怎样把pptx课件转换成word文档

如果你还没有安装python-pptxpython-docx,请先运行以下命令:

pip install python-pptx python-docx

python 复制代码
from pptx import Presentation
from docx import Document
import re

# 函数:清理文本,移除特殊字符和控制字符
def clean_text(text):
    # 移除所有控制字符和特殊字符
    cleaned_text = re.sub(r'[\x00-\x1F\x7F-\x9F]', '', text)
    return cleaned_text

# 读取PPT文件
ppt_file = 'example.pptx'
presentation = Presentation(ppt_file)

# 创建Word文档
doc = Document()

for slide in presentation.slides:
    for shape in slide.shapes:
        if hasattr(shape, "text"):
            # 清理文本内容
            cleaned_text = clean_text(shape.text)
            doc.add_paragraph(cleaned_text)

# 保存Word文档
doc_file = 'example.docx'
doc.save(doc_file)
相关推荐
TOOLS指南14 小时前
使用Pycharm实现数据可视化作品代码-Python应用
python·信息可视化·pycharm
2501_9142459314 小时前
如何修复宝塔面板由于inode耗尽导致无法创建文件_清理海量小文件缓存与会话目录
jvm·数据库·python
❆VE❆14 小时前
python基础篇(一):使用vscode搭建python相关环境
开发语言·vscode·python
2401_8371638914 小时前
WordPress后台插件隐藏策略:仅对指定管理员显示特定插件
jvm·数据库·python
qq_1898070314 小时前
C++如何验证YAML语法格式是否正确_try-catch解析校验用法【实战】
jvm·数据库·python
晨+燕14 小时前
JMeter中如何定位到某个具体的类来自于哪个jar包
python·jmeter·jar
zhangchaoxies14 小时前
c++如何读取YAML格式配置文件_yaml-cpp库快速入门【详解】
jvm·数据库·python
qq_6543669814 小时前
如何安全清理数据库中未引用的图片文件
jvm·数据库·python
一 乐14 小时前
智慧社区|基于Python + Django智慧社区系统(源码+数据库+文档)
java·数据库·python·django·论文·毕设·智慧社区系统
2401_8822737214 小时前
HTML怎么创建成就隐藏后恢复_HTML“重新公开”操作入口【详解】
jvm·数据库·python