使用 Python 编辑 XML 文件中的文本字段

在 Python 中,可以使用 xml.etree.ElementTree 模块来读取和编辑 XML 文件。下面是一个例子,演示如何编辑 XML 文件中的文本字段并保存更改。

1、问题背景

我有一个包含一些数据的 XML 文件,如下所示:

xml 复制代码
<?xml version="1.0" encoding="UTF-8" ?> 
- <ParameterData>
  <CreationInfo date="10/28/2009 03:05:14 PM" user="manoj" /> 
- <ParameterList count="85">
- <Parameter name="Spec 2 Included" type="boolean" mode="both">
  <Value>n/a</Value> 
  <Result>n/a</Result> 
  </Parameter>
- <Parameter name="Spec 2 Label" type="string" mode="both">
  <Value>n/a</Value> 
  <Result>n/a</Result> 
  </Parameter>
- <Parameter name="Spec 3 Included" type="boolean" mode="both">
  <Value>n/a</Value> 
  <Result>n/a</Result> 
  </Parameter>
- <Parameter name="Spec 3 Label" type="string" mode="both">
  <Value>n/a</Value> 
  <Result>n/a</Result> 
  </Parameter>
  </ParameterList>
  </ParameterData>

我还有一份以分行形式存储键值对的文本文件,如下所示:

text 复制代码
Spec 2 Included : TRUE
Spec 2 Label: 19-Flat2-HS3   
Spec 3 Included : FALSE
Spec 3 Label: 4-1-Bead1-HS3

我想使用 Python 将 XML 文件中的字段值(n/a)替换为文本文件中的相应值,使 XML 文件看起来像这样:

xml 复制代码
<?xml version="1.0" encoding="UTF-8" ?> 
- <ParameterData>
  <CreationInfo date="10/28/2009 03:05:14 PM" user="manoj" /> 
- <ParameterList count="85">
- <Parameter name="Spec 2 Included" type="boolean" mode="both">
  <Value>TRUE</Value> 
  <Result>TRUE</Result> 
  </Parameter>
- <Parameter name="Spec 2 Label" type="string" mode="both">
  <Value>19-Flat2-HS3</Value> 
  <Result>19-Flat2-HS3</Result> 
  </Parameter>
- <Parameter name="Spec 3 Included" type="boolean" mode="both">
  <Value>FALSE</Value> 
  <Result>FALSE</Result> 
  </Parameter>
- <Parameter name="Spec 3 Label" type="string" mode="both">
  <Value>4-1-Bead1-HS3</Value> 
  <Result>4-1-Bead1-HS3</Result> 
  </Parameter>
  </ParameterList>
  </ParameterData>

2、解决方案

以下是用 Python 实现的解决方案:

python 复制代码
import xml.etree.ElementTree as ET
import re

# 解析 XML 文件
tree = ET.parse('input.xml')
root = tree.getroot()

# 读取文本文件中的键值对
with open('values.txt', 'r') as f:
    values = dict(re.findall('(Spec \d+ (?:Included|Label))\s*:\s*(\S+)', f.read()))

# 修改 XML 文件中的字段值
for parameter in root.findall('ParameterList/Parameter'):
    name = parameter.get('name')
    if name in values:
        parameter.find('Value').text = values[name]
        parameter.find('Result').text = values[name]

# 保存修改后的 XML 文件
tree.write('output.xml')

这个解决方案使用 ElementTree 库来解析 XML 文件,并使用正则表达式来读取文本文件中的键值对。然后,它迭代 XML 文件中的 Parameter 元素,并使用 values 字典来查找每个 Parameter 的新值。最后,它将修改后的 XML 文件写入一个新的文件中。

以下是一些可以使用的代码示例:

python 复制代码
# 读取 XML 文件并创建一个 ElementTree 对象
tree = ET.parse('input.xml')

# 获取根元素
root = tree.getroot()

# 找到所有名为 'Parameter' 的子元素
parameters = root.findall('ParameterList/Parameter')

# 遍历 'Parameter' 元素并打印它们的 'name' 和 'Value' 属性
for parameter in parameters:
    print(parameter.get('name'), parameter.find('Value').text)

这个代码示例将从 input.xml 文件中读取所有名为 'Parameter' 的元素,并打印它们的 'name' 和 'Value' 属性。

python 复制代码
# 创建一个新的 ElementTree 对象并添加一个根元素
tree = ET.ElementTree()
root = ET.Element('root')
tree._setroot(root)

# 向根元素添加一个子元素
child = ET.SubElement(root, 'child')

# 设置子元素的 'name' 和 'value' 属性
child.set('name', 'my_name')
child.text = 'my_value'

# 将 ElementTree 对象保存到一个 XML 文件
tree.write('output.xml')

这个代码示例将创建一个新的 ElementTree 对象,并添加一个根元素。然后,它向根元素添加一个子元素,并设置子元素的 'name' 和 'value' 属性。最后,它将 ElementTree 对象保存到一个 XML 文件中。

注意事项

  • 保存编码tree.write()encoding="utf-8" 参数指定保存的文件编码为 UTF-8,这在处理非 ASCII 字符时很重要。
  • 备份文件:在编辑 XML 文件前,建议先备份文件,以防修改错误。

这样,你可以轻松地编辑 XML 文件中的文本字段并保存更改。

相关推荐
梦梦代码精1 分钟前
《企业开源商城选型:商业闭环、二次开发与成本平衡》
java·开发语言·低代码·开源·github
前进的李工4 分钟前
智能Agent实战指南:记忆组件嵌入技巧(记忆)
开发语言·前端·javascript·python·langchain·agent
西洼工作室7 分钟前
B站登录流程全解析:RSA+极验验证
前端·python·极验
zhaoyong2227 分钟前
如何在 MySQL 中实现基于全字段唯一性的重复行计数更新
jvm·数据库·python
狼与自由8 分钟前
灰度发布的策略
java
X56618 分钟前
为什么宝塔面板网站无法正常连接外部远程数据库_检查服务器安全组放行端口并开启IP授权
jvm·数据库·python
woxihuan12345612 分钟前
C#怎么使用CancellationToken C#如何用取消令牌优雅地取消异步任务和长时间操作【进阶】
jvm·数据库·python
神仙别闹18 分钟前
基于QT(C++)实现线性表的建立、插入、删除、查找等基本操作
java·c++·qt
测试员周周19 分钟前
【AI测试功能5】AI功能测试的“黄金数据集“构建指南:从0到1搭建质量评估体系
运维·服务器·开发语言·人工智能·python·功能测试·集成测试
yexuhgu23 分钟前
MySQL主从复制支持跨版本吗_不同版本间同步的注意事项
jvm·数据库·python