XPath:学习使用XPath语法提取HTML/XML文档中的数据使用语法

以下是一些XPath语法示例,用于提取HTML/XML文档中的数据:

  1. 选择元素:
    • 选择所有p元素: //p
    • 选择根元素: /
  2. 属性匹配:
    • 选择class属性为"example"的div元素: //div[@class='example']
  3. 文本内容提取:
    • 提取所有a元素的文本内容: //a/text()
    • 提取第一个p元素的文本内容: //p[1]/text()
  4. 使用逻辑运算符:
    • 选择同时具有class属性为"example"且id属性为"heading"的元素: //*[@class='example' and @id='heading']
  5. 使用位置谓词:
    • 选择前三个li元素: //li[position() <= 3]
    • 选择最后一个p元素: //p[last()]
  6. 使用通配符:
    • 选择所有元素: //*
    • 选择div元素下的任意子元素: //div/*
  7. 使用轴:
    • 选择div元素的所有祖先元素: //div/ancestor::*
    • 选择span元素之后的所有兄弟元素: //span/following-sibling::*

以上只是XPath语法的一些示例,您可以根据实际需求进行组合和调整。使用XPath语法,您能够更精确地选择和提取HTML/XML文档中的数据。

本文由mdnice多平台发布

相关推荐
jnene4 小时前
html 时间、价格筛选样式处理
前端·css·html
slongzhang_4 小时前
jquery 修复怪异模式html未声明“<!DOCTYPE html>”
前端·html·jquery
IMPYLH6 小时前
HTML 的 <abbr> 元素
前端·算法·html
神明不懂浪漫7 小时前
【第三章】CSS(一)——基础选择器、CSS的属性
前端·css·html·css3
小小龙学IT8 小时前
HTMX:让 HTML 重新成为前端核心的超轻量动态交互库
前端·html·交互
matlab_xiaowang9 小时前
WeasyPrint:把 HTML 变成 PDF 的文档工厂
前端·其他·pdf·html
gz-郭小敏1 天前
优化横向滚动展示大量数据的时候数据晃动问题
前端·javascript·html·css3
IMPYLH1 天前
HTML 的 <a>元素
前端·javascript·html
AI行业学习1 天前
CC‑Switch v3.16.1 免费下载(Windows+macOS+Linux)、使用方法【2026.6.11】
linux·开发语言·windows·python·macos·前端框架·html
elirlove11 天前
打造属于自己的网页工匠台:HTML在线编辑器技术深度解析
前端·编辑器·html