XPath 进阶:掌握高级选择器与路径表达式

在前面的文章中,我们了解了 XPath 的基本概念和语法。现在,我们将深入探讨 XPath 的高级选择器和路径表达式,以便更高效地查询 XML 数据。

高级选择器

位置选择器

XPath 提供了一些位置选择器,可以帮助我们选择特定位置的节点:

  • position():返回符合当前节点在节点的所有位置,是一个数组,可以对数组进行操作。

  • last():返回节点集中的最后一个节点。

  • 选择最后一个scirpt标签内容:

xpath 复制代码
//script[last()]

过滤选择器

使用方括号 [] 可以对节点进行过滤。例如,百度贴吧回帖数大于600的:

xpath 复制代码
//em[@data-num>600]

复杂路径表达式

XPath 允许我们使用复杂的路径表达式来精确定位节点。以下是一些示例:

xml 复制代码
<bookstore>
  <category name="前端开发">
    <book id="101">
      <title>JavaScript高级程序设计</title>
      <price>89.00</price>
      <stock>15</stock>
    </book>
    <book id="102">
      <title>CSS权威指南</title>
      <price>79.00</price>
      <stock>8</stock>
    </book>
  </category>
  
  <category name="后端开发">
    <book id="201">
      <title>Node.js实战</title>
      <price>69.00</price>
      <stock>12</stock>
    </book>
    <book id="202">
      <title>Python核心编程</title>
      <price>99.00</price>
      <stock>5</stock>
      <discount>0.8</discount>
    </book>
    <book id="203">
      <title>Java并发编程实战</title>
      <price>109.00</price>
      <stock>0</stock>
    </book>
  </category>
</bookstore>
  • 选择所有书籍的标题:
xpath 复制代码
//book/title
  • 选择所有价格大于 20 的书籍的标题:
xpath 复制代码
//book[price > 70]/title
  • 选择所有书籍中作者为 "王五" 的书籍:
xpath 复制代码
//book[author='王五']

使用 XPath 函数提升查询能力:从基础到复杂

XPath 提供了多种内置函数,可以帮助我们进行更复杂的查询。

常用函数

字符串函数

  • contains(string, substring):检查字符串是否包含子字符串。
  • starts-with(string, substring):检查字符串是否以特定子字符串开头。
  • substring(string, start, length):返回字符串的子串。

例如,选择所有标题中包含 "Java" 的书籍:

xpath 复制代码
//book[contains(title, 'Java')]

数学函数

  • sum(node-set):返回节点集的总和。
  • count(node-set):返回节点集中的节点数量。

选择所有书籍的总价格:

xpath 复制代码
sum(//book/price)

XPath 条件表达式与逻辑运算符的应用

XPath 支持条件表达式和逻辑运算符,使得查询更加灵活。

条件表达式

可以使用条件表达式来筛选节点。例如,选择价格在 10 到 30 之间的书籍:

xpath 复制代码
//book[price >= 70 and price <= 100]

逻辑运算符

XPath 支持 andornot() 运算符。例如,选择所有作者为 "John" 或 "Jane" 的书籍:

xpath 复制代码
//book[price=89 or price=109]

小结

如果你喜欢本教程,记得点赞+收藏!关注我获取更多JavaScript开发干货。

相关推荐
崔庆才丨静觅3 小时前
hCaptcha 验证码图像识别 API 对接教程
前端
passerby60614 小时前
完成前端时间处理的另一块版图
前端·github·web components
掘了4 小时前
「2025 年终总结」在所有失去的人中,我最怀念我自己
前端·后端·年终总结
崔庆才丨静觅4 小时前
实用免费的 Short URL 短链接 API 对接说明
前端
崔庆才丨静觅4 小时前
5分钟快速搭建 AI 平台并用它赚钱!
前端
崔庆才丨静觅5 小时前
比官方便宜一半以上!Midjourney API 申请及使用
前端
Moment5 小时前
富文本编辑器在 AI 时代为什么这么受欢迎
前端·javascript·后端
崔庆才丨静觅5 小时前
刷屏全网的“nano-banana”API接入指南!0.1元/张量产高清创意图,开发者必藏
前端
剪刀石头布啊5 小时前
jwt介绍
前端
爱敲代码的小鱼5 小时前
AJAX(异步交互的技术来实现从服务端中获取数据):
前端·javascript·ajax