XPath:学习使用XPath语法提取HTML/XML文档中的数据使用语法

以下是一些XPath语法示例,用于提取HTML/XML文档中的数据:

  1. 选择元素:
    • 选择所有p元素: //p
    • 选择根元素: /
  2. 属性匹配:
    • 选择class属性为"example"的div元素: //div[@class='example']
  3. 文本内容提取:
    • 提取所有a元素的文本内容: //a/text()
    • 提取第一个p元素的文本内容: //p[1]/text()
  4. 使用逻辑运算符:
    • 选择同时具有class属性为"example"且id属性为"heading"的元素: //*[@class='example' and @id='heading']
  5. 使用位置谓词:
    • 选择前三个li元素: //li[position() <= 3]
    • 选择最后一个p元素: //p[last()]
  6. 使用通配符:
    • 选择所有元素: //*
    • 选择div元素下的任意子元素: //div/*
  7. 使用轴:
    • 选择div元素的所有祖先元素: //div/ancestor::*
    • 选择span元素之后的所有兄弟元素: //span/following-sibling::*

以上只是XPath语法的一些示例,您可以根据实际需求进行组合和调整。使用XPath语法,您能够更精确地选择和提取HTML/XML文档中的数据。

本文由mdnice多平台发布

相关推荐
_OP_CHEN35 分钟前
【前端开发之CSS】(三)CSS 常用元素属性宝典(上):从字体到文本,手把手教你打造高颜值网页!
前端·css·html·网页开发·文本属性·字体属性·页面美化
松涛和鸣5 小时前
62、IIC通信解析
服务器·arm开发·单片机·嵌入式硬件·html
DreamNotOver6 小时前
Django 模板 {% if %} 标签空格被自动删除?VS Code 环境解决方案
django·html·格式化·空格
PieroPc6 小时前
FastAPI 和 Html+css+js 开发的 PDF打印服务器 连接到服务器的物理打印机打印
css·html·fastapi
戌中横15 小时前
JavaScript——Web APIs DOM
前端·javascript·html
yinmaisoft18 小时前
JNPF 表单模板实操:高效复用表单设计指南
前端·javascript·html
_OP_CHEN1 天前
【前端开发之CSS】(二)CSS 选择器终极指南:从基础到进阶,精准拿捏页面元素!
前端·css·html·网页开发·css选择器
ヤ鬧鬧o.1 天前
HTML安全密码备忘录
前端·javascript·css·html·css3
winfredzhang1 天前
使用 wxPython 构建文件编辑器与预览器:从零到一的完整实现
编辑器·html·markdown·预览·config
Web极客码1 天前
WordPress 6.8有哪些新特性
前端·javascript·html