python—如何提取word中指定内容

假设有一个Word,该Word中存在 "联系人" 关键字,如何将该Word中的联系人所对应的内容提取出来呢? 该Word内容如下所示:

要在给定的Word文档中提取出与"联系人"关键字对应的内容,可以使用Python的python-docx库。以下是一个示例:

python 复制代码
import docx

# 加载Word文档
doc = docx.Document('your_document.docx')

# 存储提取的内容
contacts = []

# 遍历文档中的段落并提取联系人关键字对应的内容
for paragraph in doc.paragraphs:
    if '联系人' in paragraph.text:
        # 获取关键字后面的内容
        contact = paragraph.text.split('联系人', 1)[1]
        contacts.append(contact.strip())

# 显示提取的内容
for contact in contacts:
    print(contact)

在上面的代码中,将'your_document.docx'替换为你要读取的Word文档的文件名或路径。

运行代码后,将会显示与"联系人"关键字对应的内容。请注意,在提取"联系人"关键字的内容时,假设该关键字后面的内容是需要提取的信息。如果情况不符合,可能需要根据具体的Word文档结构和需求进行调整。

确保已经安装了python-docx库。如果尚未安装,可以使用以下命令进行安装:

pip install python-docx

通过以上步骤,你就可以在Python中成功提取Word文档中与"联系人"关键字对应的内容了。

运行上述代码得到运行结果为:

python 复制代码
联系人:张三
联系人:李四
联系人:王五

若想同时获取联系人及对应的电话,则在遍历部分代码中添加 '电话' 关键字即可,如下所示:

python 复制代码
# 遍历文档中的段落并提取指定内容
for paragraph in doc.paragraphs:
    if '联系人' in paragraph.text:
        target_content.append(paragraph.text)
    elif '电话' in paragraph.text:
        target_content.append(paragraph.text)

添加之后程序运行结果:

python 复制代码
联系人:张三
电话:153***55899
联系人:李四
电话:139***08783
联系人:王五
电话:139***52328
相关推荐
m0_377618235 分钟前
HTML怎么显示速率限制重置时间_HTML X-RateLimit-Reset解析【说明】
jvm·数据库·python
u01091476013 分钟前
C#怎么实现OAuth2.0授权_C#如何对接第三方快捷登录【核心】
jvm·数据库·python
桌面运维家16 分钟前
IDV云桌面vDisk机房部署方案模板特性解析
java·开发语言·devops
2301_7775993717 分钟前
如何显著提升 Google Sheets 数据库批量更新脚本的执行效率
jvm·数据库·python
飞翔的SA20 分钟前
从6.75%到100%!大模型Function Calling终极方案:Harness工程如何驯服
开发语言·ai·llm·harness
2201_7610405924 分钟前
bootstrap怎么给div添加自定义的边框样式
jvm·数据库·python
Java后端的Ai之路26 分钟前
当大模型开始“水土不服“:从通才到专才的进化论——Fine-tuning 企业级实战全攻略
人工智能·python·langchain·rag·lcel
weixin_5689960630 分钟前
Golang怎么用K8s Job执行一次性任务_Golang如何用Job资源运行批处理和迁移任务【操作】
jvm·数据库·python
耿雨飞32 分钟前
Python 后端开发技术博客专栏 | 第 09 篇 GIL 深度解析与并发编程实战 -- 多线程、多进程、协程的选型
开发语言·python
Stark-C34 分钟前
NAS音乐必备神器,全平台音乐收割机!极空间部署『Go Music DL』
开发语言·后端·golang