pptx 文件版面分析-- python-pptx(python 文档解析提取)

安装

sql 复制代码
pip install python-pptx -i https://pypi.tuna.tsinghua.edu.cn/simple --ignore-installed

pptx 解析代码实现

python 复制代码
from pptx import Presentation
file_name = "rag_pptx/test1.pptx"
# 打开.pptx文件
ppt = Presentation(file_name)
for slide in ppt.slides:
	#print(slide)
	for shape in slide.shapes:
		if shape.has_text_frame:
			text_frame = shape.text_frame
			print(text_frame.text)

参考
【非一般程序员训练营 第二季 ------ RAG 潘多拉宝盒 任务二 版面分析模块】
python-pptx库中文文档及使用样例
pypi/python-pptx/
英文文档
中文文档

相关推荐
devnullcoffee7 小时前
亚马逊 Buy Box 数据采集完全指南(2026):Python 实战 + Pangolinfo API
开发语言·python·亚马逊数据采集·亚马逊数据 api·pangolinfo api·亚马逊 buy box 数据·亚马逊数据采集软件
imDwAaY7 小时前
贝叶斯网络到粒子滤波Python算法实现 CS188 Proj4 学习笔记
网络·人工智能·笔记·python·学习·算法
sleven fung7 小时前
Whisper库
开发语言·人工智能·python·算法·ai·whisper
ServBay8 小时前
2026年重新定义 Python 开发工作流的8个现代化工具
后端·python
l1t8 小时前
DeepSeek总结的使用实体-组件-系统和基于存在性处理进行Python编程37-38
开发语言·python
迷藏4948 小时前
Python+DuckDB:轻量级BI流水线实战
java·开发语言·python·原型模式
乘凉~8 小时前
一键获取Youtube播放列表视频里的标题和链接
windows·python
lunzi_08268 小时前
【学习笔记】《Python编程 从入门到实践》第6章:字典创建、遍历与嵌套用法详解
python·字典·python 入门
databook9 小时前
用SymPy自动计算抛物线求根、判别式与顶点
python·数学·动效
新手村领路人9 小时前
在macos python中安装dlib
开发语言·python·macos