Python XML 解析
引言
XML(可扩展标记语言)是一种用于存储和传输数据的标记语言。Python作为一种广泛使用的编程语言,提供了多种库用于解析XML文件。本文将详细介绍Python中XML解析的常用方法,包括xml.etree.ElementTree和lxml库,以及它们的使用场景和注意事项。
XML 基础
在深入了解Python XML解析之前,我们先简单了解XML的基础知识。XML文档由一系列的元素组成,每个元素都可以包含属性和子元素。以下是一个简单的XML示例:
xml
<?xml version="1.0"?>
<root>
<book id="001">
<title>Python编程</title>
<author>张三</author>
<price>49.99</price>
</book>
<book id="002">
<title>Java编程</title>
<author>李四</author>
<price>39.99</price>
</book>
</root>
Python XML 解析方法
1. xml.etree.ElementTree
xml.etree.ElementTree是Python标准库中的一个XML解析库,用于解析和创建XML文档。以下是一个使用ElementTree解析XML的示例:
python
import xml.etree.ElementTree as ET
xml_data = '''
<?xml version="1.0"?>
<root>
<book id="001">
<title>Python编程</title>
<author>张三</author>
<price>49.99</price>
</book>
<book id="002">
<title>Java编程</title>
<author>李四</author>
<price>39.99</price>
</book>
</root>
'''
# 解析XML
root = ET.fromstring(xml_data)
# 获取书名
for book in root.findall('book'):
print(book.find('title').text)
# 获取价格
for book in root.findall('book'):
print(book.find('price').text)
2. lxml
lxml是一个基于C语言实现的Python XML解析库,具有高性能和易用性。以下是一个使用lxml解析XML的示例:
python
from lxml import etree
xml_data = '''
<?xml version="1.0"?>
<root>
<book id="001">
<title>Python编程</title>
<author>张三</author>
<price>49.99</price>
</book>
<book id="002">
<title>Java编程</title>
<author>李四</author>
<price>39.99</price>
</book>
</root>
'''
# 解析XML
root = etree.fromstring(xml_data)
# 获取书名
for book in root.xpath('//book'):
print(book.xpath('title/text()'))
# 获取价格
for book in root.xpath('//book'):
print(book.xpath('price/text()'))
总结
Python提供了多种XML解析方法,包括xml.etree.ElementTree和lxml库。xml.etree.ElementTree简单易用,而lxml具有高性能。在实际应用中,可以根据需求选择合适的XML解析方法。本文介绍了Python XML解析的基础知识、常用方法和注意事项,希望能对您有所帮助。