python ----- xml 命名空间与xpath详解

一、简介

本文章以如下xml 样例进行讲解命名空间和xpath

python 复制代码
xml_text="""<?xml version="1.0"?>
            <actors xmlns:fictional="http://characters.example.com"
                    xmlns="http://people.example.com">
                <actor>
                    <name>John Cleese</name>
                    <fictional:character>Lancelot</fictional:character>
                    <fictional:character>Archie Leach</fictional:character>
                </actor>
                <actor>
                    <name>Eric Idle</name>
                    <fictional:character>Sir Robin</fictional:character>
                    <fictional:character>Gunther</fictional:character>
                    <fictional:character>Commander Clement</fictional:character>
                </actor>
            </actors>"""

二、xml命名空间和find命令

xml中可以没有默认命名空间,但是如果要有,只能有一个默认命名空间;当一个xml使用了命名空间语法,则find/findall方法必须使用带有命名空间的调用方式否则无法查询数据。实例如下:

python 复制代码
root = ET.fromstring(xml_text)
for actor in root.findall('actor'):   # 结果为空
    name = actor.find('{http://people.example.com}name')
    print(name.text)
    for char in actor.findall('{http://characters.example.com}character'):
        print(' |-->', char.text)
python 复制代码
find(match, namespaces=None)
findall(match, namespaces=None)

其中的namespaces是一个dict类型或者一个空字符串,使用方式如下:

python 复制代码
ns1={'role1':'url1'}
find('role1:tag1',ns1)  #查询命名空间在url1的tag1

实例如下:

python 复制代码
ns = {'real_person': 'http://people.example.com',
      'role': 'http://characters.example.com'}

for actor in root.findall('real_person:actor', ns):
    name = actor.find('real_person:name', ns)
    print(name.text)
    for char in actor.findall('role:character', ns):
        print(' |-->', char.text)

或者

python 复制代码
find('{url1}tag1')  #查询命名空间在url1的tag1

实例如下:

python 复制代码
root = fromstring(xml_text)
for actor in root.findall('{http://people.example.com}actor'):
    name = actor.find('{http://people.example.com}name')
    print(name.text)
    for char in actor.findall('{http://characters.example.com}character'):
        print(' |-->', char.text)

三、xpath详解

语法 示例 说明
tag find("tag1") 查询标签为tag1的第一层子元素;spam/tag1 查询标签为spam的第一层子元素下的tag1标签
// find(".//a") 其中.是必须的,否则会报错;该语句会返回当前元素下的所有级别上的a标签,(不包含当前元素)
* find("*") 查询当前级别下的所有子元素,*/egg 查询当前层级下grandchild elements为egg的元素
[position] 位置是指当前层级下第一层子元素的位置,0代表第一个,1代表第二个,依此类推,-1代表倒数第二个

注意: 谓词(方括号内的表达式)前面必须有标记名称、星号或其他谓词。position 谓词前面必须有一个标记名称。

2、实践

find(*)

python 复制代码
xml_text1="<a name1='a1'><a name2='a2'><a name3='a3'></a></a><a name2_1='a2_1'><a name3_1='a3_1'></a></a></a>"
root1 = ET.fromstring(xml_text1)
for a in root1.findall('*'):
    print(a.attrib)
    
PS C:\Users\love1\Documents\technology\python\project\test1> python .\test-xml.py
{'name2': 'a2'}
{'name2_1': 'a2_1'}

child elements 第一层子元素

grandchild elements 第二层子元素

subelements 所有子元素

on all levels beneath the current element 在当前元素下的所有级别上

引用

python xml xpath

相关推荐
CoderCodingNo1 分钟前
【CSP】CSP-J 2019 江西真题 | 次大值 luogu-P5682 (适合GESP四、五级及以上考生练习)
开发语言·c++·算法
djjdjdjdjjdj14 分钟前
PHP函数如何监控CPU温度传感器_PHP读取核心温度硬件值【详解】
jvm·数据库·python
Hui Baby16 分钟前
java抠图
java·开发语言
m0_6138562918 分钟前
c++怎么把多个变量一次性写入二进制文件_结构体对齐与write【实战】
jvm·数据库·python
Dxy123931021620 分钟前
Python设置Excel表格边框样式:从基础到高级
前端·python·excel
gihigo199821 分钟前
30节点系统最优潮流计算(MATLAB实现)
开发语言·matlab
꧁细听勿语情꧂41 分钟前
向下调整算法,top - k 问题,链式结构二叉树,前中后序遍历
c语言·开发语言·数据结构·算法
qq_460978401 小时前
html标签怎么表示小字号文字_small标签语义说明【操作】
jvm·数据库·python
qq_413502021 小时前
SQL更新语句性能调优技巧_避免对索引列执行函数操作
jvm·数据库·python
2301_817672261 小时前
如何正确为包含浮动子元素的父容器设置完整背景色
jvm·数据库·python