XPath:学习使用XPath语法提取HTML/XML文档中的数据使用语法

以下是一些XPath语法示例,用于提取HTML/XML文档中的数据:

  1. 选择元素:
    • 选择所有p元素: //p
    • 选择根元素: /
  2. 属性匹配:
    • 选择class属性为"example"的div元素: //div[@class='example']
  3. 文本内容提取:
    • 提取所有a元素的文本内容: //a/text()
    • 提取第一个p元素的文本内容: //p[1]/text()
  4. 使用逻辑运算符:
    • 选择同时具有class属性为"example"且id属性为"heading"的元素: //*[@class='example' and @id='heading']
  5. 使用位置谓词:
    • 选择前三个li元素: //li[position() <= 3]
    • 选择最后一个p元素: //p[last()]
  6. 使用通配符:
    • 选择所有元素: //*
    • 选择div元素下的任意子元素: //div/*
  7. 使用轴:
    • 选择div元素的所有祖先元素: //div/ancestor::*
    • 选择span元素之后的所有兄弟元素: //span/following-sibling::*

以上只是XPath语法的一些示例,您可以根据实际需求进行组合和调整。使用XPath语法,您能够更精确地选择和提取HTML/XML文档中的数据。

本文由mdnice多平台发布

相关推荐
a11177621 分钟前
粒子化系统(3D-Particles)THreeJS react
前端·html·jetson
半壶清水2 小时前
用python脚本加html自建的书法字典
开发语言·python·html
YG亲测源码屋5 小时前
html表白代码大全可复制免费 html表白网页制作源码
前端·html
LIUAWEIO19 小时前
CSS 让鼠标呈现手型,鼠标悬浮变小手
css·html·css3·html5
ZC跨境爬虫1 天前
跟着 MDN 学CSS day_51:支持旧浏览器的布局策略
前端·css·html·tensorflow·媒体
DFT计算杂谈1 天前
VASP 磁性结构可视化:一键生成完美 VESTA / MCIF
java·前端·css·html·css3
a1117761 天前
Aholo Viewer 3DGS渲染器 开源html
前端·html
Js_x1 天前
HTML实现类星露谷小游戏
css·html·css3
Solis程序员1 天前
拿捏登录安全:RS256 + 双令牌,把非法请求拦在 Redis 白名单门外
java·安全·缓存·面试·bootstrap·html
cq林志炫1 天前
fastadmin 如何限制访问public\assets\libs目录下面的所有html文件
html·php·fastadmin