pptx 文件版面分析-- python-pptx(python 文档解析提取)

安装

sql 复制代码
pip install python-pptx -i https://pypi.tuna.tsinghua.edu.cn/simple --ignore-installed

pptx 解析代码实现

python 复制代码
from pptx import Presentation
file_name = "rag_pptx/test1.pptx"
# 打开.pptx文件
ppt = Presentation(file_name)
for slide in ppt.slides:
	#print(slide)
	for shape in slide.shapes:
		if shape.has_text_frame:
			text_frame = shape.text_frame
			print(text_frame.text)

参考
【非一般程序员训练营 第二季 ------ RAG 潘多拉宝盒 任务二 版面分析模块】
python-pptx库中文文档及使用样例
pypi/python-pptx/
英文文档
中文文档

相关推荐
hef28821 分钟前
SQL和Python怎么选?数据分析工具实战指南
python·sql·数据分析
徐安安ye22 分钟前
FlashAttention长程依赖建模:局部+全局的Hybrid Spiral结构设计
python·深度学习·机器学习
IT策士42 分钟前
Django 从 0 到 1 打造完整电商平台:商品排序与浏览量统计
后端·python·django
godspeed_lucip1 小时前
LLM和Agent——专题3: Agentic Workflow 入门(4)
人工智能·python
godspeed_lucip1 小时前
LLM和Agent——专题3: Agentic Workflow 入门(2)
网络·人工智能·python
mingshili1 小时前
[Python] Python中自带模块级的单例模式-不需要定义单例类
python·单例模式
alphaTao1 小时前
LeetCode 每日一题 2026/5/18-2026/5/24
python·leetcode
徐安安_ye11 小时前
FlashAttention学习路线:从调API到写算子,你该走哪条路
python·学习
IT策士2 小时前
Django 从 0 到 1 打造完整电商平台:商品搜索
后端·python·django
茉莉玫瑰花茶2 小时前
LangGraph 持久化(Persistence)[ 2 ]
开发语言·python·ai·langgraph