XPath:学习使用XPath语法提取HTML/XML文档中的数据使用语法

以下是一些XPath语法示例,用于提取HTML/XML文档中的数据:

  1. 选择元素:
    • 选择所有p元素: //p
    • 选择根元素: /
  2. 属性匹配:
    • 选择class属性为"example"的div元素: //div[@class='example']
  3. 文本内容提取:
    • 提取所有a元素的文本内容: //a/text()
    • 提取第一个p元素的文本内容: //p[1]/text()
  4. 使用逻辑运算符:
    • 选择同时具有class属性为"example"且id属性为"heading"的元素: //*[@class='example' and @id='heading']
  5. 使用位置谓词:
    • 选择前三个li元素: //li[position() <= 3]
    • 选择最后一个p元素: //p[last()]
  6. 使用通配符:
    • 选择所有元素: //*
    • 选择div元素下的任意子元素: //div/*
  7. 使用轴:
    • 选择div元素的所有祖先元素: //div/ancestor::*
    • 选择span元素之后的所有兄弟元素: //span/following-sibling::*

以上只是XPath语法的一些示例,您可以根据实际需求进行组合和调整。使用XPath语法,您能够更精确地选择和提取HTML/XML文档中的数据。

本文由mdnice多平台发布

相关推荐
威哥爱编程8 分钟前
屌炸天!一句话搞定一个商用级的商城列表页面
html·ai编程·trae
Java&Develop8 小时前
html写一个象棋游戏
javascript·游戏·html
w2sfot9 小时前
JS代码压缩
前端·javascript·html
dagouaofei12 小时前
手术室护理年终PPT怎么做?
前端·python·html·powerpoint
这儿有一堆花12 小时前
从 Markdown 到 HTML 的正确构建路径
前端·html
Pyeako13 小时前
操作HTML网页(PyCharm版)
爬虫·python·html
秋邱13 小时前
AR 技术创新与商业化新方向:AI+AR 融合,抢占 2025 高潜力赛道
前端·人工智能·后端·python·html·restful
咬人喵喵14 小时前
网页开发的“三剑客”:HTML、CSS 和 JavaScript
javascript·css·html
顾安r14 小时前
12.8 脚本网页 井字棋
前端·stm32·django·html
CodeCraft Studio14 小时前
国产化Word处理组件Spire.DOC教程:通过Python将HTML转换为TXT文本
python·html·word·python编程·spire.doc·html转txt