XPath:学习使用XPath语法提取HTML/XML文档中的数据使用语法

以下是一些XPath语法示例,用于提取HTML/XML文档中的数据:

  1. 选择元素:
    • 选择所有p元素: //p
    • 选择根元素: /
  2. 属性匹配:
    • 选择class属性为"example"的div元素: //div[@class='example']
  3. 文本内容提取:
    • 提取所有a元素的文本内容: //a/text()
    • 提取第一个p元素的文本内容: //p[1]/text()
  4. 使用逻辑运算符:
    • 选择同时具有class属性为"example"且id属性为"heading"的元素: //*[@class='example' and @id='heading']
  5. 使用位置谓词:
    • 选择前三个li元素: //li[position() <= 3]
    • 选择最后一个p元素: //p[last()]
  6. 使用通配符:
    • 选择所有元素: //*
    • 选择div元素下的任意子元素: //div/*
  7. 使用轴:
    • 选择div元素的所有祖先元素: //div/ancestor::*
    • 选择span元素之后的所有兄弟元素: //span/following-sibling::*

以上只是XPath语法的一些示例,您可以根据实际需求进行组合和调整。使用XPath语法,您能够更精确地选择和提取HTML/XML文档中的数据。

本文由mdnice多平台发布

相关推荐
PieroPc21 分钟前
用FastAPI 后端 和 HTML/CSS/JavaScript 前端写一个博客系统 例
前端·html·fastapi
名字越长技术越强23 分钟前
html\css\js(一)
javascript·css·html
hunter145027 分钟前
2026.1.4 html简单制作
java·前端·笔记·html
前端小脑虎11 小时前
2026版最新 HTML零基础小白完整版学习指南(通俗易懂+条理清晰+企业主流技术)
html
释怀不想释怀11 小时前
vue布局,动态路由
前端·html
梦帮科技15 小时前
第三十四篇:开源社区运营:GitHub Stars增长策略
开发语言·前端·爬虫·python·docker·架构·html
程序员刘禹锡18 小时前
定位与图标字体知识点全解析!!!(12.31)
前端·css·html·css3
json{shen:"jing"}18 小时前
06_事件处理
前端·javascript·html
松涛和鸣18 小时前
44、HTML与HTTP服务器交互笔记
linux·运维·服务器·http·链表·html
烤麻辣烫20 小时前
黑马大事件学习-19(文章)
前端·css·vue.js·学习·html