怎样把pptx课件转换成word文档

如果你还没有安装python-pptxpython-docx,请先运行以下命令:

pip install python-pptx python-docx

python 复制代码
from pptx import Presentation
from docx import Document
import re

# 函数:清理文本,移除特殊字符和控制字符
def clean_text(text):
    # 移除所有控制字符和特殊字符
    cleaned_text = re.sub(r'[\x00-\x1F\x7F-\x9F]', '', text)
    return cleaned_text

# 读取PPT文件
ppt_file = 'example.pptx'
presentation = Presentation(ppt_file)

# 创建Word文档
doc = Document()

for slide in presentation.slides:
    for shape in slide.shapes:
        if hasattr(shape, "text"):
            # 清理文本内容
            cleaned_text = clean_text(shape.text)
            doc.add_paragraph(cleaned_text)

# 保存Word文档
doc_file = 'example.docx'
doc.save(doc_file)
相关推荐
CTA终结者11 分钟前
期货开仓前保证金够吗:get_account 可用与占用字段对照
python·区块链
开源量化GO13 分钟前
夜盘白盘衔接几分钟误下单:天勤交易时段与行情过滤
python·区块链
辣椒思密达43 分钟前
Python公开数据采集实战:如何解决请求高频拦截与Session会话中断问题
开发语言·python
Albart5751 小时前
Python 实战教程:用 30 分钟学会解决真实问题
开发语言·python
2301_773643621 小时前
ceph池
开发语言·ceph·python
极客笔记Jack2 小时前
Scanpy AnnData 对象深度解析:高效操作数据结构的10个技巧
python
颜酱2 小时前
LangChain调用向量模型,存入向量数据库
python·langchain
2501_928945522 小时前
七本性全面签名体系:从互递归类型到∞-范畴生成语法
python
2601_961194023 小时前
考研资料电子版|去哪找|网盘
java·c语言·c++·python·考研·php
veminhe3 小时前
关于下载pip install faiss-cpu失败的问题
python·pip·faiss