用python实现提取word中的所有图片

你可以使用python-docx库来处理word文件,然后遍历文件中的所有形状,找到图片。

首先,你需要安装python-docx库。在命令行中输入以下命令进行安装:

复制代码

复制代码

|---|---------------------------|
| | pip install python-docx |

然后,你可以使用以下代码提取word文件中的所有图片:

复制代码

python复制代码

|---|---------------------------------------------|
| | from docx import Document |
| | from docx.shared import Inches |
| | |
| | def extract_images(filename): |
| | # 加载word文件 |
| | doc = Document(filename) |
| | |
| | # 存储图片路径的列表 |
| | image_paths = [] |
| | |
| | # 遍历文件中的所有形状 |
| | for shape in doc.shapes: |
| | # 如果形状是图片,则添加到列表中 |
| | if shape.has_image: |
| | image_paths.append(shape.image.filename) |
| | |
| | return image_paths |

这个函数会返回一个列表,其中包含word文件中所有图片的路径。

请注意,这个函数只能提取word文件中嵌入的图片,无法提取链接的图片。如果你需要提取链接的图片,你可能需要使用更复杂的工具或库,如python-docx的高级版python-docx-image-to-data。

相关推荐
Cloud_Shy61820 小时前
解读《Effective Python 3rd Edition》:从练气到老魔(第七章 Item 51)
开发语言·人工智能·笔记·python·学习方法
AI+程序员在路上20 小时前
CSP、PP、PV、HM 在 CiA402 标准下的差异解析
linux·c语言·开发语言·嵌入式硬件
nix.gnehc20 小时前
Python 并发深度解析
服务器·开发语言·python
我是一颗柠檬20 小时前
【Java项目技术亮点】Leaf号段模式双Buffer优化
java·开发语言·分布式·后端·架构
Cx330❀20 小时前
【MySQL基础】详解MySQL数据类型:底层原理、越界测试与最佳实践
linux·开发语言·数据库·c++·mysql
Volunteer Technology20 小时前
Flink 时间、窗口及操作(二)
java·python·flink
星恒随风20 小时前
C++ string 入门(一)
开发语言·c++·笔记·学习
skywalk816320 小时前
继续推进心语项目6.15 @CodeArts
开发语言·算法·编程
嵌入式-老费20 小时前
esp32开发与应用(看门狗测试)
java·开发语言·数据库
闫有尽意无琼21 小时前
qt控件未指定父对象或delete致堆内存泄露
开发语言·qt