XPath:学习使用XPath语法提取HTML/XML文档中的数据使用语法

以下是一些XPath语法示例,用于提取HTML/XML文档中的数据:

  1. 选择元素:
    • 选择所有p元素: //p
    • 选择根元素: /
  2. 属性匹配:
    • 选择class属性为"example"的div元素: //div[@class='example']
  3. 文本内容提取:
    • 提取所有a元素的文本内容: //a/text()
    • 提取第一个p元素的文本内容: //p[1]/text()
  4. 使用逻辑运算符:
    • 选择同时具有class属性为"example"且id属性为"heading"的元素: //*[@class='example' and @id='heading']
  5. 使用位置谓词:
    • 选择前三个li元素: //li[position() <= 3]
    • 选择最后一个p元素: //p[last()]
  6. 使用通配符:
    • 选择所有元素: //*
    • 选择div元素下的任意子元素: //div/*
  7. 使用轴:
    • 选择div元素的所有祖先元素: //div/ancestor::*
    • 选择span元素之后的所有兄弟元素: //span/following-sibling::*

以上只是XPath语法的一些示例,您可以根据实际需求进行组合和调整。使用XPath语法,您能够更精确地选择和提取HTML/XML文档中的数据。

本文由mdnice多平台发布

相关推荐
tod1131 天前
Redis 数据类型与 C++ 客户端实践指南(redis-plus-plus)
前端·c++·redis·bootstrap·html
henry1010101 天前
Deepseek辅助生成的HTML5网页版抄经典《弟子规》
前端·javascript·css·html·html5
想睡好1 天前
标签的ref属性
前端·javascript·html
henry1010101 天前
HTML5小游戏 - 数字消除 · 合并2048
前端·游戏·html·html5
杨超越luckly1 天前
HTML应用指南:利用GET请求获取中国邮政网点位置信息
前端·python·arcgis·html·php·数据可视化
Go_Zezhou1 天前
render网站保存历史记录错误解决
开发语言·git·python·html
CappuccinoRose1 天前
HTML语法学习文档(三)
前端·学习·html·html5·标签·实体字符
小九今天不码代码1 天前
HTML + CSS 实现鼠标悬停触发的全景动画效果
html·css动画·网页特效·前端交互·纯css效果·鼠标悬停动画·全景滑动效果
星火开发设计2 天前
类模板:实现通用数据结构的基础
java·开发语言·数据结构·c++·html·知识
卷卷的小趴菜学编程2 天前
项目篇----仿tcmalloc的内存池设计(内存回收)
前端·后端·html·tcmalloc·内存池