XPath语法详解及案例讲解

XPath(XML Path Language)是一种查询语言,用于在XML或HTML文档中定位节点元素。Selenium广泛使用XPath来定位网页中的元素,尤其适用于复杂的层级结构或属性定位。


1. 基本语法与案例

语法 描述 示例 案例
/ 绝对路径,从根节点开始 /html/body/div 定位根节点下的第一个div元素。
// 相对路径,从任意位置开始 //div 定位文档中所有的div元素。
* 匹配任意元素 //*[@class='btn'] 定位class为btn的所有元素。
@ 属性定位 //input[@id='username'] 定位id="username"的输入框。
text() 定位包含特定文本内容的元素 //button[text()='提交'] 定位文本内容为"提交"的按钮。
contains() 模糊匹配,包含指定值 //div[contains(@class, 'header')] 定位class包含header的所有div元素。
starts-with() 定位以指定值开头的属性 //input[starts-with(@id, 'user')] 定位iduser开头的输入框。

2. XPath 轴选择

轴语法 描述 示例 案例
parent:: 定位父节点 //button/parent::div 定位按钮的父节点div
child:: 定位子节点 //div/child::p 定位div的直接子节点p元素。
ancestor:: 定位祖先节点 //span/ancestor::div 定位span的所有祖先节点div元素。
descendant:: 定位后代节点 //div/descendant::span 定位div下的所有后代节点span
following-sibling:: 定位后续兄弟节点 //h2/following-sibling::p 定位h2标签之后的所有兄弟节点p元素。
preceding-sibling:: 定位前面的兄弟节点 //h2/preceding-sibling::p 定位h2标签之前的所有兄弟节点p元素。

3. XPath 高级用法

3.1 多条件定位
复制代码
//input[@type='text' and @placeholder='请输入用户名']

案例 :定位一个输入框,要求type="text"placeholder="请输入用户名"

3.2 分组定位
复制代码
//div[@id='menu'] | //span[@class='icon']

案例 :同时定位id="menu"divclass="icon"span

3.3 索引定位
复制代码
//ul/li[3]

案例 :定位列表中第3个li元素。


4. 结合案例使用

4.1 定位登录表单
复制代码
//form[@id='loginForm']/input[@name='username']

解释 :定位id="loginForm"的表单内,name="username"的输入框。

4.2 定位特定表格单元格
复制代码
//table[@id='dataTable']/tbody/tr[2]/td[3]

解释 :定位id="dataTable"表格的第2行、第3列。


5. 特殊场景用法

5.1 子节点查找父节点
复制代码
//span[@class='child']/parent::div

案例 :通过class="child"span元素定位其父节点div

5.2 使用文本的模糊查找
复制代码
//a[contains(text(), '更多')]

案例:定位文本中包含"更多"的链接。

5.3 动态元素定位
复制代码
//button[starts-with(@id, 'submit')]

案例 :定位idsubmit开头的按钮。

5.4 复合条件与轴结合
复制代码
//div[@class='content']/descendant::p[text()='文章正文']

案例 :定位class="content"div中,包含文本"文章正文"的p元素。


6. XPath 调试技巧

  1. 浏览器工具:使用 Chrome 或 Firefox 的开发者工具,在控制台中直接测试 XPath 表达式。
  2. 高效定位 :尽量避免使用绝对路径(/html/body/...),多使用相对路径(//div)。
  3. 结合调试工具:如插件 XPath Helper 或 Selenium IDE 快速验证 XPath。
相关推荐
小雨下雨的雨10 小时前
井字棋AI机器人实现详解 - Minimax算法实战-鸿蒙PC Electron框架完成
前端·人工智能·算法·华为·electron·鸿蒙
xieliyu.12 小时前
Java算法精讲:双指针(三)
java·开发语言·算法
明夜之约12 小时前
Spring Boot 自动装配源码
java·spring boot·后端
Leaton Lee12 小时前
Spring Boot分层架构详解:从Controller到Service再到Mapper的完整流程
java·spring boot·后端·架构
Jinkxs12 小时前
Resilience4j- 与 Spring Boot 快速集成:自动配置与基础注解使用
java·spring boot·后端
辣机小司12 小时前
【踩坑记录:Spring Boot 配置文件读取值不一致?警惕 YAML 的“八进制陷阱”与 SnakeYAML 版本之谜】
java·spring boot·后端·yaml·踩坑记录
ZC跨境爬虫13 小时前
跟着 MDN 学JavaScript day_7:数学运算与逻辑判断实战测试
开发语言·前端·javascript·学习·ecmascript
fangdengfu12313 小时前
ES分析系统各个服务日志占用量
java·前端·elasticsearch
凌云拓界14 小时前
文件管理:让AI安全操作你的电脑 ——CogitoAgent开发实战(三)
javascript·人工智能·架构·开源·node.js
云烟成雨TD14 小时前
Spring AI 1.x 系列【51】可观测性技术选型
java·人工智能·spring