XPath:学习使用XPath语法提取HTML/XML文档中的数据使用语法

以下是一些XPath语法示例,用于提取HTML/XML文档中的数据:

  1. 选择元素:
    • 选择所有p元素: //p
    • 选择根元素: /
  2. 属性匹配:
    • 选择class属性为"example"的div元素: //div[@class='example']
  3. 文本内容提取:
    • 提取所有a元素的文本内容: //a/text()
    • 提取第一个p元素的文本内容: //p[1]/text()
  4. 使用逻辑运算符:
    • 选择同时具有class属性为"example"且id属性为"heading"的元素: //*[@class='example' and @id='heading']
  5. 使用位置谓词:
    • 选择前三个li元素: //li[position() <= 3]
    • 选择最后一个p元素: //p[last()]
  6. 使用通配符:
    • 选择所有元素: //*
    • 选择div元素下的任意子元素: //div/*
  7. 使用轴:
    • 选择div元素的所有祖先元素: //div/ancestor::*
    • 选择span元素之后的所有兄弟元素: //span/following-sibling::*

以上只是XPath语法的一些示例,您可以根据实际需求进行组合和调整。使用XPath语法,您能够更精确地选择和提取HTML/XML文档中的数据。

本文由mdnice多平台发布

相关推荐
编程之升级打怪8 小时前
网页端即时通信应用消息列表的更新逻辑
html·信息与通信
会编程的土豆9 小时前
简易植物大战僵尸游戏 JavaScript版之html
javascript·游戏·html
GGGG寄了11 小时前
CSS——CSS引入方式+选择器类型
前端·css·html
qq_124987075311 小时前
基于html的书城阅读器系统的设计与实现(源码+论文+部署+安装)
前端·vue.js·spring boot·后端·mysql·信息可视化·html
a177988771212 小时前
小程序为什么 Upload 外层使用 display: flex 时会造成组件样式混乱
css·html·css3
咩咩不吃草12 小时前
【HTML】核心标签与【Python爬虫库】实战指南
css·爬虫·python·html
2601_9498574313 小时前
Flutter for OpenHarmony Web开发助手App实战:HTML参考
前端·flutter·html
fanruitian1 天前
div水平垂直居中
前端·javascript·html
Smart-Space2 天前
cpphtmlbuilder-c++灵活构造html
c++·html
tao3556672 天前
HTML-03-HTML 语义化标签
前端·html