XPath:学习使用XPath语法提取HTML/XML文档中的数据使用语法

以下是一些XPath语法示例,用于提取HTML/XML文档中的数据:

  1. 选择元素:
    • 选择所有p元素: //p
    • 选择根元素: /
  2. 属性匹配:
    • 选择class属性为"example"的div元素: //div[@class='example']
  3. 文本内容提取:
    • 提取所有a元素的文本内容: //a/text()
    • 提取第一个p元素的文本内容: //p[1]/text()
  4. 使用逻辑运算符:
    • 选择同时具有class属性为"example"且id属性为"heading"的元素: //*[@class='example' and @id='heading']
  5. 使用位置谓词:
    • 选择前三个li元素: //li[position() <= 3]
    • 选择最后一个p元素: //p[last()]
  6. 使用通配符:
    • 选择所有元素: //*
    • 选择div元素下的任意子元素: //div/*
  7. 使用轴:
    • 选择div元素的所有祖先元素: //div/ancestor::*
    • 选择span元素之后的所有兄弟元素: //span/following-sibling::*

以上只是XPath语法的一些示例,您可以根据实际需求进行组合和调整。使用XPath语法,您能够更精确地选择和提取HTML/XML文档中的数据。

本文由mdnice多平台发布

相关推荐
liudongyang1239 分钟前
EasyExcel使用模版填充的方式,导致单元格边框消失
前端·html
我命由我1234511 小时前
VSCode - VSCode 修改文件树缩进
前端·ide·vscode·前端框架·编辑器·html·js
我命由我1234513 小时前
VSCode - VSCode 颜色值快速转换
前端·ide·vscode·前端框架·编辑器·html·js
BD_Marathon14 小时前
【JavaWeb】HTML_常见标签_表单项标签
html
hjt_未来可期16 小时前
js实现复制、粘贴文字
前端·javascript·html
白狐_79817 小时前
【项目实战】我用一个 HTML 文件写了一个“CET-6 单词斩”
前端·算法·html
BD_Marathon19 小时前
【JavaWeb】HTML常见标签——标题段落和换行
前端·html
Minecraft红客19 小时前
HTMLminecraft版本
游戏·3d·html·娱乐
一嘴一个橘子19 小时前
html css - 左边是不能滚动的目录,右边是可以滚动的内容
css·html
白粥20 小时前
HTML标题标签<h1>到<h6>
前端·html