用python实现提取word中的所有图片

你可以使用python-docx库来处理word文件,然后遍历文件中的所有形状,找到图片。

首先,你需要安装python-docx库。在命令行中输入以下命令进行安装:

复制代码

复制代码

|---|---------------------------|
| | pip install python-docx |

然后,你可以使用以下代码提取word文件中的所有图片:

复制代码

python复制代码

|---|---------------------------------------------|
| | from docx import Document |
| | from docx.shared import Inches |
| | |
| | def extract_images(filename): |
| | # 加载word文件 |
| | doc = Document(filename) |
| | |
| | # 存储图片路径的列表 |
| | image_paths = [] |
| | |
| | # 遍历文件中的所有形状 |
| | for shape in doc.shapes: |
| | # 如果形状是图片,则添加到列表中 |
| | if shape.has_image: |
| | image_paths.append(shape.image.filename) |
| | |
| | return image_paths |

这个函数会返回一个列表,其中包含word文件中所有图片的路径。

请注意,这个函数只能提取word文件中嵌入的图片,无法提取链接的图片。如果你需要提取链接的图片,你可能需要使用更复杂的工具或库,如python-docx的高级版python-docx-image-to-data。

相关推荐
xixixin_6 分钟前
【JavaScript 】从 || 到??:JavaScript 空值处理的最佳实践升级
开发语言·javascript·ecmascript
玩大数据的龙威9 分钟前
农经权二轮延包—各种地块示意图
python·arcgis
ZH154558913111 分钟前
Flutter for OpenHarmony Python学习助手实战:数据库操作与管理的实现
python·学习·flutter
belldeep20 分钟前
python:用 Flask 3 , mistune 2 和 mermaid.min.js 10.9 来实现 Markdown 中 mermaid 图表的渲染
javascript·python·flask
喵手20 分钟前
Python爬虫实战:电商价格监控系统 - 从定时任务到历史趋势分析的完整实战(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·电商价格监控系统·从定时任务到历史趋势分析·采集结果sqlite存储
m0_7369191021 分钟前
C++中的委托构造函数
开发语言·c++·算法
喵手33 分钟前
Python爬虫实战:京东/淘宝搜索多页爬虫实战 - 从反爬对抗到数据入库的完整工程化方案(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·京东淘宝页面数据采集·反爬对抗到数据入库·采集结果csv导出
lsx20240636 分钟前
Python3 SMTP发送邮件教程
开发语言
懈尘37 分钟前
从 Java 1.7 到 Java 21:逐版本深入解析新特性与平台演进
java·开发语言
凉辰40 分钟前
使用uni.createInnerAudioContext()播放指定音频(踩坑分享功能)
开发语言·javascript·音视频