python ----- xml 命名空间与xpath详解

一、简介

本文章以如下xml 样例进行讲解命名空间和xpath

python 复制代码
xml_text="""<?xml version="1.0"?>
            <actors xmlns:fictional="http://characters.example.com"
                    xmlns="http://people.example.com">
                <actor>
                    <name>John Cleese</name>
                    <fictional:character>Lancelot</fictional:character>
                    <fictional:character>Archie Leach</fictional:character>
                </actor>
                <actor>
                    <name>Eric Idle</name>
                    <fictional:character>Sir Robin</fictional:character>
                    <fictional:character>Gunther</fictional:character>
                    <fictional:character>Commander Clement</fictional:character>
                </actor>
            </actors>"""

二、xml命名空间和find命令

xml中可以没有默认命名空间,但是如果要有,只能有一个默认命名空间;当一个xml使用了命名空间语法,则find/findall方法必须使用带有命名空间的调用方式否则无法查询数据。实例如下:

python 复制代码
root = ET.fromstring(xml_text)
for actor in root.findall('actor'):   # 结果为空
    name = actor.find('{http://people.example.com}name')
    print(name.text)
    for char in actor.findall('{http://characters.example.com}character'):
        print(' |-->', char.text)
python 复制代码
find(match, namespaces=None)
findall(match, namespaces=None)

其中的namespaces是一个dict类型或者一个空字符串,使用方式如下:

python 复制代码
ns1={'role1':'url1'}
find('role1:tag1',ns1)  #查询命名空间在url1的tag1

实例如下:

python 复制代码
ns = {'real_person': 'http://people.example.com',
      'role': 'http://characters.example.com'}

for actor in root.findall('real_person:actor', ns):
    name = actor.find('real_person:name', ns)
    print(name.text)
    for char in actor.findall('role:character', ns):
        print(' |-->', char.text)

或者

python 复制代码
find('{url1}tag1')  #查询命名空间在url1的tag1

实例如下:

python 复制代码
root = fromstring(xml_text)
for actor in root.findall('{http://people.example.com}actor'):
    name = actor.find('{http://people.example.com}name')
    print(name.text)
    for char in actor.findall('{http://characters.example.com}character'):
        print(' |-->', char.text)

三、xpath详解

语法 示例 说明
tag find("tag1") 查询标签为tag1的第一层子元素;spam/tag1 查询标签为spam的第一层子元素下的tag1标签
// find(".//a") 其中.是必须的,否则会报错;该语句会返回当前元素下的所有级别上的a标签,(不包含当前元素)
* find("*") 查询当前级别下的所有子元素,*/egg 查询当前层级下grandchild elements为egg的元素
[position] 位置是指当前层级下第一层子元素的位置,0代表第一个,1代表第二个,依此类推,-1代表倒数第二个

注意: 谓词(方括号内的表达式)前面必须有标记名称、星号或其他谓词。position 谓词前面必须有一个标记名称。

2、实践

find(*)

python 复制代码
xml_text1="<a name1='a1'><a name2='a2'><a name3='a3'></a></a><a name2_1='a2_1'><a name3_1='a3_1'></a></a></a>"
root1 = ET.fromstring(xml_text1)
for a in root1.findall('*'):
    print(a.attrib)
    
PS C:\Users\love1\Documents\technology\python\project\test1> python .\test-xml.py
{'name2': 'a2'}
{'name2_1': 'a2_1'}

child elements 第一层子元素

grandchild elements 第二层子元素

subelements 所有子元素

on all levels beneath the current element 在当前元素下的所有级别上

引用

python xml xpath

相关推荐
西部秋虫13 分钟前
YOLO 训练车牌定位模型 + OpenCV C++ 部署完整步骤
c++·python·yolo·车牌识别
likuolei22 分钟前
XQuery 完整语法速查表(2025 最新版,XQuery 3.1)
xml·java·数据库
CryptoPP43 分钟前
使用 KLineChart 这个轻量级的前端图表库
服务器·开发语言·前端·windows·后端·golang
18你磊哥1 小时前
chromedriver.exe的使用和python基本处理
开发语言·python
小坏讲微服务1 小时前
Spring Cloud Alibaba 整合 Scala 教程完整使用
java·开发语言·分布式·spring cloud·sentinel·scala·后端开发
Kiri霧1 小时前
Scala 循环控制:掌握 while 和 for 循环
大数据·开发语言·scala
闲人编程1 小时前
Python的抽象基类(ABC):定义接口契约的艺术
开发语言·python·接口·抽象类·基类·abc·codecapsule
qq_172805591 小时前
Go 语言结构型设计模式深度解析
开发语言·设计模式·golang
vx_dmxq2111 小时前
【微信小程序学习交流平台】(免费领源码+演示录像)|可做计算机毕设Java、Python、PHP、小程序APP、C#、爬虫大数据、单片机、文案
java·spring boot·python·mysql·微信小程序·小程序·idea
无垠的广袤2 小时前
【工业树莓派 CM0 NANO 单板计算机】本地部署 EMQX
linux·python·嵌入式硬件·物联网·树莓派·emqx·工业物联网