Python提取xml节点

xml.etree.ElementTree 是 Python 标准库中的模块,用于解析和处理 XML 数据。它提供了一种简单的方式来解析 XML 文件并将其表示为树结构,使得可以方便地遍历和操作 XML 数据。

要使用 xml.etree.ElementTree 模块,你可以导入它并使用其中的函数和类来处理 XML 数据。以下是一些常见的操作:

  1. xml.etree.ElementTree.parse(file):解析 XML 文件并返回一个树对象。
  2. xml.etree.ElementTree.Element:表示 XML 元素的类。
  3. Element.find(tag):在当前元素的子元素中搜索指定标签的第一个匹配项。
  4. Element.findall(tag):在当前元素的子元素中搜索所有匹配指定标签的项。
  5. Element.text:获取元素的文本内容。
  6. Element.attrib:获取元素的属性字典。

这些功能可以帮助你在 Python 中处理 XML 数据,例如解析 XML 文件、提取特定标签的内容、修改 XML 结构等。

对于以下xml内容,需要获取Progress中的内容

xml 复制代码
<Log>
			<Progress>C:\Users\lenovo\Desktop\Progress.txt</Progress>
			<Error>C:\Users\lenovo\Desktop\Error.txt</Error>
</Log>
python 复制代码
import xml.etree.ElementTree as ET
tree = ET.parse(xml_path)
root = tree.getroot()
progress = root.find(".//Log/Progress")
progress_content=progress.text

使用find方法获取节点,且注意父节点.//,子节点/。使用.text提取文本

而对于xml中含有的多个相同结构的子节点

xml 复制代码
<Inputs ParameterNum="2">				                   
		    <Parameter>
			    <ParaName>InputndviPath</ParaName>			     
			    <ParaChsName>tiff格式ndvi</ParaChsName>
			    <ParaType>File</ParaType>			           
			    <DataType>tiff</DataType>  			           
			    <ParaSource>Cal</ParaSource>		     
			    <ParaValue>F:\土壤水分算法封装\exe\ndvi.tif</ParaValue>
			    <OptionValue>DEFAULT</OptionValue>			         
			    <filePath>DEFAULT</filePath>
			</Parameter>
			<Parameter>
				<ParaName>InputlstPath</ParaName>
				<ParaChsName>tiff格式lst</ParaChsName>
				<ParaType>File</ParaType>
				<DataType>tiff</DataType>
				<ParaSource>Cal</ParaSource>
				<ParaValue>F:\土壤水分算法封装\exe\lst.tif</ParaValue>
				<OptionValue>DEFAULT</OptionValue>
				<filePath>DEFAULT</filePath>
			</Parameter>
		</Inputs>
python 复制代码
tree = ET.parse(xml_path)
root = tree.getroot()
 inputs = root.find(".//Inputs")
        parameter_num_inputs = inputs.get("ParameterNum")
        inputs_para_value = []
        for parameter in inputs.findall("Parameter"):
            inputs_para_value.append(parameter.find("ParaValue").text)  # 获取参数
        ndvipath = str(inputs_para_value[0])  # 影像路径
        lstpath = str(inputs_para_value[1])

可以使用findall的方法

相关推荐
我要洋人死12 分钟前
导航栏及下拉菜单的实现
前端·css·css3
龙哥说跨境23 分钟前
如何利用指纹浏览器爬虫绕过Cloudflare的防护?
服务器·网络·python·网络爬虫
科技探秘人24 分钟前
Chrome与火狐哪个浏览器的隐私追踪功能更好
前端·chrome
科技探秘人24 分钟前
Chrome与傲游浏览器性能与功能的深度对比
前端·chrome
JerryXZR30 分钟前
前端开发中ES6的技术细节二
前端·javascript·es6
七星静香32 分钟前
laravel chunkById 分块查询 使用时的问题
java·前端·laravel
q24985969334 分钟前
前端预览word、excel、ppt
前端·word·excel
小白学大数据39 分钟前
正则表达式在Kotlin中的应用:提取图片链接
开发语言·python·selenium·正则表达式·kotlin
小华同学ai40 分钟前
wflow-web:开源啦 ,高仿钉钉、飞书、企业微信的审批流程设计器,轻松打造属于你的工作流设计器
前端·钉钉·飞书
flashman91141 分钟前
python在word中插入图片
python·microsoft·自动化·word