Python面试题:如何在 Python 中解析 XML 文件?

在 Python 中解析 XML 文件可以使用内置的 xml.etree.ElementTree 模块。以下是一个示例,展示了如何使用这个模块解析 XML 文件:

  1. 读取 XML 文件:
python 复制代码
import xml.etree.ElementTree as ET

# 读取 XML 文件
tree = ET.parse('example.xml')
root = tree.getroot()

# 打印根元素的标签
print(root.tag)
  1. 遍历 XML 树:
python 复制代码
# 遍历 XML 树
for child in root:
    print(child.tag, child.attrib)
    for subchild in child:
        print(subchild.tag, subchild.text)
  1. 查找特定元素:
python 复制代码
# 查找特定元素
for element in root.findall('element_name'):
    print(element.tag, element.attrib)
    for subelement in element:
        print(subelement.tag, subelement.text)
  1. 获取元素的属性和文本:
python 复制代码
# 获取元素的属性和文本
for element in root.iter('element_name'):
    print('Attribute:', element.get('attribute_name'))
    print('Text:', element.text)
  1. 修改 XML 文件:
python 复制代码
# 修改元素的文本
for element in root.iter('element_name'):
    element.text = 'new text'

# 保存修改后的 XML 文件
tree.write('modified_example.xml')
  1. 创建新的 XML 文件:
python 复制代码
# 创建新的 XML 文件
root = ET.Element('root')
child = ET.SubElement(root, 'child')
child.text = 'child text'

tree = ET.ElementTree(root)
tree.write('new_example.xml')

下面是一个完整的示例,假设我们有一个 XML 文件 example.xml 内容如下:

xml 复制代码
<root>
    <child name="child1">
        <subchild>subchild1</subchild>
    </child>
    <child name="child2">
        <subchild>subchild2</subchild>
    </child>
</root>

解析这个文件并打印每个元素的信息:

python 复制代码
import xml.etree.ElementTree as ET

# 读取 XML 文件
tree = ET.parse('example.xml')
root = tree.getroot()

# 打印根元素的标签
print('Root tag:', root.tag)

# 遍历 XML 树
for child in root:
    print('Child tag:', child.tag, 'Attributes:', child.attrib)
    for subchild in child:
        print(' Subchild tag:', subchild.tag, 'Text:', subchild.text)

# 查找特定元素
for element in root.findall('child'):
    print('Found child tag:', element.tag, 'Attributes:', element.attrib)
    for subelement in element:
        print(' Subchild tag:', subelement.tag, 'Text:', subelement.text)

# 获取元素的属性和文本
for element in root.iter('child'):
    print('Attribute:', element.get('name'))
    for subelement in element:
        print('Text:', subelement.text)

这段代码会输出:

Root tag: root
Child tag: child Attributes: {'name': 'child1'}
 Subchild tag: subchild Text: subchild1
Child tag: child Attributes: {'name': 'child2'}
 Subchild tag: subchild Text: subchild2
Found child tag: child Attributes: {'name': 'child1'}
 Subchild tag: subchild tag: subchild Text: subchild1
Found child tag: child Attributes: {'name': 'child2'}
 Subchild tag: subchild Text: subchild2
Attribute: child1
Text: subchild1
Attribute: child2
Text: subchild2

这个示例展示了如何解析 XML 文件,遍历其内容并提取信息。根据具体需求,可以进一步修改和扩展解析逻辑。

相关推荐
nuclear201127 分钟前
使用Python 在Excel中创建和取消数据分组 - 详解
python·excel数据分组·创建excel分组·excel分类汇总·excel嵌套分组·excel大纲级别·取消excel分组
Lucky小小吴42 分钟前
有关django、python版本、sqlite3版本冲突问题
python·django·sqlite
陪学1 小时前
百度遭初创企业指控抄袭,维权还是碰瓷?
人工智能·百度·面试·职场和发展·产品运营
GIS 数据栈1 小时前
每日一书 《基于ArcGIS的Python编程秘笈》
开发语言·python·arcgis
爱分享的码瑞哥1 小时前
Python爬虫中的IP封禁问题及其解决方案
爬虫·python·tcp/ip
傻啦嘿哟2 小时前
如何使用 Python 开发一个简单的文本数据转换为 Excel 工具
开发语言·python·excel
大数据编程之光2 小时前
Flink Standalone集群模式安装部署全攻略
java·大数据·开发语言·面试·flink
B站计算机毕业设计超人2 小时前
计算机毕业设计SparkStreaming+Kafka旅游推荐系统 旅游景点客流量预测 旅游可视化 旅游大数据 Hive数据仓库 机器学习 深度学习
大数据·数据仓库·hadoop·python·kafka·课程设计·数据可视化
IT古董3 小时前
【人工智能】Python在机器学习与人工智能中的应用
开发语言·人工智能·python·机器学习
湫ccc3 小时前
《Python基础》之pip换国内镜像源
开发语言·python·pip