pptx 文件版面分析-- python-pptx(python 文档解析提取)

安装

sql 复制代码
pip install python-pptx -i https://pypi.tuna.tsinghua.edu.cn/simple --ignore-installed

pptx 解析代码实现

python 复制代码
from pptx import Presentation
file_name = "rag_pptx/test1.pptx"
# 打开.pptx文件
ppt = Presentation(file_name)
for slide in ppt.slides:
	#print(slide)
	for shape in slide.shapes:
		if shape.has_text_frame:
			text_frame = shape.text_frame
			print(text_frame.text)

参考
【非一般程序员训练营 第二季 ------ RAG 潘多拉宝盒 任务二 版面分析模块】
python-pptx库中文文档及使用样例
pypi/python-pptx/
英文文档
中文文档

相关推荐
名字不相符3 分钟前
[NCTF 2018]flask真香(个人记录,思路分析,学习知识,相关工具)
python·学习·flask·ctf
闲人编程4 分钟前
Flask蓝图系统:模块化应用架构设计
后端·python·flask·api·蓝图·应用工厂·codecapsul
WebGISer_白茶乌龙桃6 分钟前
PyroSAR 安装后出现 “No module named _gdal_array”
python
小小测试开发10 分钟前
FastAPI 完全入门指南:从环境搭建到实战部署
python·fastapi
(●—●)橘子……12 分钟前
力扣344.反转字符串 练习理解
python·学习·算法·leetcode·职场和发展
本妖精不是妖精13 分钟前
在 CentOS 7 上部署 Node.js 18 + Claude Code
linux·python·centos·node.js·claudecode
Vanranrr16 分钟前
Python vs PowerShell:自动化 C++ 配置文件的两种实现方案
c++·python·自动化
andwhataboutit?23 分钟前
cuda环境安装
python
子午23 分钟前
【交通标志识别系统】Python+TensorFlow+Django+人工智能+深度学习+卷积神经网络算法
人工智能·python·深度学习
测试老哥23 分钟前
Postman接口测试
自动化测试·软件测试·python·测试工具·职场和发展·接口测试·postman