XPath语法详解及案例讲解

XPath(XML Path Language)是一种查询语言,用于在XML或HTML文档中定位节点元素。Selenium广泛使用XPath来定位网页中的元素,尤其适用于复杂的层级结构或属性定位。


1. 基本语法与案例

语法 描述 示例 案例
/ 绝对路径,从根节点开始 /html/body/div 定位根节点下的第一个div元素。
// 相对路径,从任意位置开始 //div 定位文档中所有的div元素。
* 匹配任意元素 //*[@class='btn'] 定位class为btn的所有元素。
@ 属性定位 //input[@id='username'] 定位id="username"的输入框。
text() 定位包含特定文本内容的元素 //button[text()='提交'] 定位文本内容为"提交"的按钮。
contains() 模糊匹配,包含指定值 //div[contains(@class, 'header')] 定位class包含header的所有div元素。
starts-with() 定位以指定值开头的属性 //input[starts-with(@id, 'user')] 定位iduser开头的输入框。

2. XPath 轴选择

轴语法 描述 示例 案例
parent:: 定位父节点 //button/parent::div 定位按钮的父节点div
child:: 定位子节点 //div/child::p 定位div的直接子节点p元素。
ancestor:: 定位祖先节点 //span/ancestor::div 定位span的所有祖先节点div元素。
descendant:: 定位后代节点 //div/descendant::span 定位div下的所有后代节点span
following-sibling:: 定位后续兄弟节点 //h2/following-sibling::p 定位h2标签之后的所有兄弟节点p元素。
preceding-sibling:: 定位前面的兄弟节点 //h2/preceding-sibling::p 定位h2标签之前的所有兄弟节点p元素。

3. XPath 高级用法

3.1 多条件定位
复制代码
//input[@type='text' and @placeholder='请输入用户名']

案例 :定位一个输入框,要求type="text"placeholder="请输入用户名"

3.2 分组定位
复制代码
//div[@id='menu'] | //span[@class='icon']

案例 :同时定位id="menu"divclass="icon"span

3.3 索引定位
复制代码
//ul/li[3]

案例 :定位列表中第3个li元素。


4. 结合案例使用

4.1 定位登录表单
复制代码
//form[@id='loginForm']/input[@name='username']

解释 :定位id="loginForm"的表单内,name="username"的输入框。

4.2 定位特定表格单元格
复制代码
//table[@id='dataTable']/tbody/tr[2]/td[3]

解释 :定位id="dataTable"表格的第2行、第3列。


5. 特殊场景用法

5.1 子节点查找父节点
复制代码
//span[@class='child']/parent::div

案例 :通过class="child"span元素定位其父节点div

5.2 使用文本的模糊查找
复制代码
//a[contains(text(), '更多')]

案例:定位文本中包含"更多"的链接。

5.3 动态元素定位
复制代码
//button[starts-with(@id, 'submit')]

案例 :定位idsubmit开头的按钮。

5.4 复合条件与轴结合
复制代码
//div[@class='content']/descendant::p[text()='文章正文']

案例 :定位class="content"div中,包含文本"文章正文"的p元素。


6. XPath 调试技巧

  1. 浏览器工具:使用 Chrome 或 Firefox 的开发者工具,在控制台中直接测试 XPath 表达式。
  2. 高效定位 :尽量避免使用绝对路径(/html/body/...),多使用相对路径(//div)。
  3. 结合调试工具:如插件 XPath Helper 或 Selenium IDE 快速验证 XPath。
相关推荐
yqcoder1 分钟前
React 深度解析:类组件 (Class) vs 函数组件 (Function)
前端·javascript·react.js
派大星酷3 分钟前
AOP 完整精讲:原理、核心概念、五种通知、切点语法、自定义注解实战
java·mysql·spring
七颗糖很甜3 分钟前
预警!超级厄尔尼诺即将登场:2026-2027年全球气候或迎“极端狂暴模式”
java·大数据·python·算法·github
HwJack205 分钟前
HarmonyOS 开发中Web 组件渲染进程崩溃后的“起死回生”
前端·华为·harmonyos
HyaCinth5 分钟前
一人一周,用 Codex 渐进式迁移重构了一个材料学组件库
前端·javascript·css
夫礼者12 分钟前
【极简监控】挖出被遗忘的 JMX 金矿:用 Jolokia + Hawtio 把 VisualVM 搬进浏览器
java·监控·jolokia·jmx·hawtio
Slow菜鸟13 分钟前
Java 开发环境安装指南(7) | Nginx 安装
java·开发语言·nginx
沐苏瑶13 分钟前
Java反序列化漏洞
java·开发语言·网络安全
心.c16 分钟前
大厂高频手写题
开发语言·前端·javascript
Rsun045512 小时前
为什么要配置maven
java·maven