XPath:学习使用XPath语法提取HTML/XML文档中的数据使用语法

以下是一些XPath语法示例,用于提取HTML/XML文档中的数据:

  1. 选择元素:
    • 选择所有p元素: //p
    • 选择根元素: /
  2. 属性匹配:
    • 选择class属性为"example"的div元素: //div[@class='example']
  3. 文本内容提取:
    • 提取所有a元素的文本内容: //a/text()
    • 提取第一个p元素的文本内容: //p[1]/text()
  4. 使用逻辑运算符:
    • 选择同时具有class属性为"example"且id属性为"heading"的元素: //*[@class='example' and @id='heading']
  5. 使用位置谓词:
    • 选择前三个li元素: //li[position() <= 3]
    • 选择最后一个p元素: //p[last()]
  6. 使用通配符:
    • 选择所有元素: //*
    • 选择div元素下的任意子元素: //div/*
  7. 使用轴:
    • 选择div元素的所有祖先元素: //div/ancestor::*
    • 选择span元素之后的所有兄弟元素: //span/following-sibling::*

以上只是XPath语法的一些示例,您可以根据实际需求进行组合和调整。使用XPath语法,您能够更精确地选择和提取HTML/XML文档中的数据。

本文由mdnice多平台发布

相关推荐
冥界摄政王3 小时前
Cesium学习第二章 camera 相机
node.js·html·vue3·js·cesium
韩曙亮4 小时前
【Web APIs】移动端轮播图案例 ( 轮播图自动播放 | 设置无缝衔接滑动 | 手指滑动轮播图 | 完整代码示例 )
前端·javascript·css·html·轮播图·移动端·web apis
PieroPc5 小时前
Html +css+js 写的一个小商城系统(POS系统)
javascript·css·html
顾安r5 小时前
1.1 脚本网页 战推棋
java·前端·游戏·html·virtualenv
Channing Lewis17 小时前
Python读取excel转成html,并且复制excel中单元格的颜色(字体或填充)
python·html·excel
0思必得021 小时前
[Web自动化] Requests模块基本使用
运维·前端·python·自动化·html·web自动化
代码游侠1 天前
学习笔记——HTML网页开发基础
运维·服务器·开发语言·笔记·学习·html
@菜菜_达1 天前
前端 HTML 入门(标签)
前端·html
网络风云1 天前
HTML 模块化方案
前端·html
灯把黑夜烧了一个洞1 天前
2026年跨年倒计时网页版
javascript·css·html·2026跨年代码·新年代码