XPath：学习使用XPath语法提取HTML/XML文档中的数据使用语法

wq0317872023-08-28 15:08

以下是一些XPath语法示例，用于提取HTML/XML文档中的数据：

选择元素：
- 选择所有p元素： //p
- 选择根元素： /
属性匹配：
- 选择class属性为"example"的div元素： //div[@class='example']
文本内容提取：
- 提取所有a元素的文本内容： //a/text()
- 提取第一个p元素的文本内容： //p[1]/text()
使用逻辑运算符：
- 选择同时具有class属性为"example"且id属性为"heading"的元素： //*[@class='example' and @id='heading']
使用位置谓词：
- 选择前三个li元素： //li[position() <= 3]
- 选择最后一个p元素： //p[last()]
使用通配符：
- 选择所有元素： //*
- 选择div元素下的任意子元素： //div/*
使用轴：
- 选择div元素的所有祖先元素： //div/ancestor::*
- 选择span元素之后的所有兄弟元素： //span/following-sibling::*

以上只是XPath语法的一些示例，您可以根据实际需求进行组合和调整。使用XPath语法，您能够更精确地选择和提取HTML/XML文档中的数据。

本文由mdnice多平台发布