Xpaht self::div 轴语法

self::div 是 XPath 里的 轴语法,意思是:

复制代码
当前节点自己是不是 div 标签

比如这个 XPath:

复制代码
//*[self::div and contains(@class, 'title')]

可以拆开理解:

复制代码
//* 

先找页面上所有元素。

复制代码
[self::div and contains(@class, 'title')]

然后筛选:当前这个元素本身必须是 div,并且 class 包含 title

所以它基本等价于:

复制代码
//div[contains(@class, 'title')]

你看到的这段:

复制代码
//*[self::div and (contains(@class, 'title') or contains(@class, 'desc_block'))]

意思是:

复制代码
找所有元素里,当前元素本身是 div,并且 class 包含 title 或 desc_block 的元素

等价于更普通的写法:

复制代码
//div[contains(@class, 'title') or contains(@class, 'desc_block')]

那为什么有时候用 self::div

主要是为了方便兼容多个标签类型。比如你不确定弹框文案是在 divspanp 哪个标签里,可以写:

复制代码
//*[self::div or self::span or self::p]

意思是:

复制代码
当前元素可以是 div,也可以是 span,也可以是 p

例如:

复制代码
//*[self::div or self::span or self::p]
[contains(translate(normalize-space(.), 'ABCDEFGHIJKLMNOPQRSTUVWXYZ', 'abcdefghijklmnopqrstuvwxyz'), 'your verification')]
[contains(translate(normalize-space(.), 'ABCDEFGHIJKLMNOPQRSTUVWXYZ', 'abcdefghijklmnopqrstuvwxyz'), 'under review')]

如果你这里只想匹配 div,可以不用 self::div,直接写:

复制代码
String xpath =
        "//div[(contains(@class, 'title') or contains(@class, 'desc_block')) "
                + "and contains(translate(normalize-space(.), 'ABCDEFGHIJKLMNOPQRSTUVWXYZ', 'abcdefghijklmnopqrstuvwxyz'), 'your verification') "
                + "and contains(translate(normalize-space(.), 'ABCDEFGHIJKLMNOPQRSTUVWXYZ', 'abcdefghijklmnopqrstuvwxyz'), 'under review')]";

这个更直观。


如果你想更通用,兼容 div/span/p,就用 self::

复制代码
String xpath =
        "//*[(self::div or self::span or self::p) "
                + "and (contains(@class, 'title') or contains(@class, 'desc_block')) "
                + "and contains(translate(normalize-space(.), 'ABCDEFGHIJKLMNOPQRSTUVWXYZ', 'abcdefghijklmnopqrstuvwxyz'), 'your verification') "
                + "and contains(translate(normalize-space(.), 'ABCDEFGHIJKLMNOPQRSTUVWXYZ', 'abcdefghijklmnopqrstuvwxyz'), 'under review')]";

简单记:

复制代码
self::div

就是:

复制代码
当前节点自己是 div

self::span

就是:

复制代码
当前节点自己是 span

self::div or self::span

就是:

复制代码
当前节点可以是 div 或 span

你这个场景,如果 DOM 里确定就是 div,直接用 //div[...] 就行;如果前端标签可能变,用 //*[self::div or self::span or self::p ...] 更稳。

相关推荐
LDR00611 天前
Type-C 快充全面升级!LDR6601 赋能个人护理便携电机,重塑剃须刀 / 理发器新体验
c语言·开发语言
雪碧聊技术11 天前
Tree.js是什么?一文讲透
开发语言·javascript·ecmascript
码云数智-园园11 天前
C++20 Modules 模块详解
java·开发语言·spring
swordbob11 天前
NIO的channel中什么是 fd(File Descriptor,文件描述符)
java·开发语言·nio
源分享11 天前
Java线程同步的多种实现方法(非常详细)
java·开发语言·jvm
Luminous.11 天前
C语言--day30
c语言·开发语言
何以解忧,唯有..11 天前
Go语言循环语句详解:for、range与循环控制
开发语言·算法·golang
謓泽11 天前
C语言不是语法,是通往机器的地图。
c语言·开发语言
云水一下11 天前
从零开始学 PHP 系列(一):PHP 的前世今生与开发环境搭建
开发语言·php
飞天狗11111 天前
零基础JavaWeb入门——第五课第二小节:九大内置对象 · 第2个:response(响应对象)
java·开发语言