pptx 文件版面分析-- python-pptx(python 文档解析提取)

安装

sql 复制代码
pip install python-pptx -i https://pypi.tuna.tsinghua.edu.cn/simple --ignore-installed

pptx 解析代码实现

python 复制代码
from pptx import Presentation
file_name = "rag_pptx/test1.pptx"
# 打开.pptx文件
ppt = Presentation(file_name)
for slide in ppt.slides:
	#print(slide)
	for shape in slide.shapes:
		if shape.has_text_frame:
			text_frame = shape.text_frame
			print(text_frame.text)

参考
【非一般程序员训练营 第二季 ------ RAG 潘多拉宝盒 任务二 版面分析模块】
python-pptx库中文文档及使用样例
pypi/python-pptx/
英文文档
中文文档

相关推荐
PeterClerk19 分钟前
基于Pygame的贪吃蛇小游戏实现
开发语言·python·pygame
Lightning-py27 分钟前
Python使用(...)连接字符串
开发语言·python
梅孔立34 分钟前
linux 默认 python 2.7 版本没有pip安装教程
linux·python·pip
Jesse_Kyrie43 分钟前
配置windows环境下独立浏览器爬虫方案【不依赖系统环境与chrome】
前端·chrome·爬虫·python·scrapy
pyniu1 小时前
研0学习Python基础4
开发语言·python
DZSpace1 小时前
Python脚本:将Word文档转换为Excel文件
python·word·excel
Wen.py.java1 小时前
Python商务数据分析知识专栏(五)——Python数据分析的应用③使用Pandas进行数据预处理
python·数据分析·pandas
白骑士所长1 小时前
白骑士的Python教学基础篇 1.5 数据结构
开发语言·python
网恋褙骗八万1 小时前
pytorch跑手写体实验
人工智能·pytorch·python
沐光-NIE1 小时前
配置jupyter时出现问题?怎么办?
python·深度学习·jupyter