XPath:学习使用XPath语法提取HTML/XML文档中的数据使用语法

以下是一些XPath语法示例,用于提取HTML/XML文档中的数据:

  1. 选择元素:
    • 选择所有p元素: //p
    • 选择根元素: /
  2. 属性匹配:
    • 选择class属性为"example"的div元素: //div[@class='example']
  3. 文本内容提取:
    • 提取所有a元素的文本内容: //a/text()
    • 提取第一个p元素的文本内容: //p[1]/text()
  4. 使用逻辑运算符:
    • 选择同时具有class属性为"example"且id属性为"heading"的元素: //*[@class='example' and @id='heading']
  5. 使用位置谓词:
    • 选择前三个li元素: //li[position() <= 3]
    • 选择最后一个p元素: //p[last()]
  6. 使用通配符:
    • 选择所有元素: //*
    • 选择div元素下的任意子元素: //div/*
  7. 使用轴:
    • 选择div元素的所有祖先元素: //div/ancestor::*
    • 选择span元素之后的所有兄弟元素: //span/following-sibling::*

以上只是XPath语法的一些示例,您可以根据实际需求进行组合和调整。使用XPath语法,您能够更精确地选择和提取HTML/XML文档中的数据。

本文由mdnice多平台发布

相关推荐
每天吃饭的羊1 小时前
水平,垂直居中
前端·javascript·html
亿牛云爬虫专家1 小时前
告别空壳HTML!Node.js + Playwright + 代理IP 优雅抓取动态网页实战
node.js·html·爬虫代理·动态网页·数据抓取·代理ip·playwright
隔窗听雨眠2 小时前
HTML头部元信息避坑指南
前端·html
Wect3 小时前
HTML5 原生拖拽 API 基础原理与核心机制
前端·面试·html
shadowcz0074 小时前
CHI 2026 归来:AI/LLM 正在重写人机交互的底层语法
前端·人工智能·html·人机交互
fqrj20264 小时前
网站建设公司怎么选?国内口碑网站建设公司推荐哪家?
大数据·人工智能·html·网站开发
之歆4 小时前
Day01_HTML 基础知识完全指南:从零开始的 Web 开发之旅
前端·html
yivifu4 小时前
接近完善的HTML双行夹批显示方案
前端·javascript·html·html双行夹批
捧月华如4 小时前
HTML/CSS基础:构建网页的骨架与样式
前端·css·html
赵庆明老师20 小时前
vben开发入门5:vite.config.ts
前端·html·vue3·vben