用python实现提取word中的所有图片

你可以使用python-docx库来处理word文件,然后遍历文件中的所有形状,找到图片。

首先,你需要安装python-docx库。在命令行中输入以下命令进行安装:

复制代码

复制代码

|---|---------------------------|
| | pip install python-docx |

然后,你可以使用以下代码提取word文件中的所有图片:

复制代码

python复制代码

|---|---------------------------------------------|
| | from docx import Document |
| | from docx.shared import Inches |
| | |
| | def extract_images(filename): |
| | # 加载word文件 |
| | doc = Document(filename) |
| | |
| | # 存储图片路径的列表 |
| | image_paths = [] |
| | |
| | # 遍历文件中的所有形状 |
| | for shape in doc.shapes: |
| | # 如果形状是图片,则添加到列表中 |
| | if shape.has_image: |
| | image_paths.append(shape.image.filename) |
| | |
| | return image_paths |

这个函数会返回一个列表,其中包含word文件中所有图片的路径。

请注意,这个函数只能提取word文件中嵌入的图片,无法提取链接的图片。如果你需要提取链接的图片,你可能需要使用更复杂的工具或库,如python-docx的高级版python-docx-image-to-data。

相关推荐
何大春8 分钟前
【弱监督语义分割】Self-supervised Image-specific Prototype Exploration for WSSS 论文阅读
论文阅读·人工智能·python·深度学习·论文笔记·原型模式
在下不上天16 分钟前
Flume日志采集系统的部署,实现flume负载均衡,flume故障恢复
大数据·开发语言·python
SEVEN-YEARS20 分钟前
深入理解TensorFlow中的形状处理函数
人工智能·python·tensorflow
EterNity_TiMe_25 分钟前
【论文复现】(CLIP)文本也能和图像配对
python·学习·算法·性能优化·数据分析·clip
陌小呆^O^30 分钟前
Cmakelist.txt之win-c-udp-client
c语言·开发语言·udp
Suyuoa36 分钟前
附录2-pytorch yolov5目标检测
python·深度学习·yolo
I_Am_Me_1 小时前
【JavaEE进阶】 JavaScript
开发语言·javascript·ecmascript
重生之我是数学王子1 小时前
QT基础 编码问题 定时器 事件 绘图事件 keyPressEvent QT5.12.3环境 C++实现
开发语言·c++·qt
Ai 编码助手1 小时前
使用php和Xunsearch提升音乐网站的歌曲搜索效果
开发语言·php
学习前端的小z1 小时前
【前端】深入理解 JavaScript 逻辑运算符的优先级与短路求值机制
开发语言·前端·javascript