pptx 文件版面分析-- python-pptx(python 文档解析提取)

安装

sql 复制代码
pip install python-pptx -i https://pypi.tuna.tsinghua.edu.cn/simple --ignore-installed

pptx 解析代码实现

python 复制代码
from pptx import Presentation
file_name = "rag_pptx/test1.pptx"
# 打开.pptx文件
ppt = Presentation(file_name)
for slide in ppt.slides:
	#print(slide)
	for shape in slide.shapes:
		if shape.has_text_frame:
			text_frame = shape.text_frame
			print(text_frame.text)

参考
【非一般程序员训练营 第二季 ------ RAG 潘多拉宝盒 任务二 版面分析模块】
python-pptx库中文文档及使用样例
pypi/python-pptx/
英文文档
中文文档

相关推荐
码界奇点3 分钟前
基于Django REST framework与Vue的前后端分离后台管理系统设计与实现
vue.js·后端·python·django·毕业设计·源代码管理
倔强的小石头_10 分钟前
Python 从入门到实战(六):字典(关联数据的 “高效管家”)
java·服务器·python
翔云 OCR API12 分钟前
企业工商信息查验API-快速核验企业信息-营业执照文字识别接口
前端·数据库·人工智能·python·mysql
BTU_YC14 分钟前
python 内网部署
开发语言·python
ytao_wang19 分钟前
pip install -e .报错ModuleNotFoundError: No module named ‘torch‘
pytorch·python·深度学习
斯班奇的好朋友阿法法28 分钟前
JAVA映射实体类对象和LIst
java·python·list
大城市里的小麻雀33 分钟前
ragflow在linux系统中下载镜像一直卡着不动
python·ai
黑客思维者38 分钟前
Python自动化截图/录屏3大方案(PIL/mss/ffmpeg)深度拆解
python·ffmpeg·自动化·录屏
爱写bug的野原新之助41 分钟前
10_异常处理
开发语言·python
肥猪猪爸41 分钟前
TextToSql——Vanna的安装与使用
人工智能·python·算法·机器学习·大模型·ollama·vanna