XPath:学习使用XPath语法提取HTML/XML文档中的数据使用语法

以下是一些XPath语法示例,用于提取HTML/XML文档中的数据:

  1. 选择元素:
    • 选择所有p元素: //p
    • 选择根元素: /
  2. 属性匹配:
    • 选择class属性为"example"的div元素: //div[@class='example']
  3. 文本内容提取:
    • 提取所有a元素的文本内容: //a/text()
    • 提取第一个p元素的文本内容: //p[1]/text()
  4. 使用逻辑运算符:
    • 选择同时具有class属性为"example"且id属性为"heading"的元素: //*[@class='example' and @id='heading']
  5. 使用位置谓词:
    • 选择前三个li元素: //li[position() <= 3]
    • 选择最后一个p元素: //p[last()]
  6. 使用通配符:
    • 选择所有元素: //*
    • 选择div元素下的任意子元素: //div/*
  7. 使用轴:
    • 选择div元素的所有祖先元素: //div/ancestor::*
    • 选择span元素之后的所有兄弟元素: //span/following-sibling::*

以上只是XPath语法的一些示例,您可以根据实际需求进行组合和调整。使用XPath语法,您能够更精确地选择和提取HTML/XML文档中的数据。

本文由mdnice多平台发布

相关推荐
烤麻辣烫2 小时前
黑马大事件学习-15(前端登录页面)
前端·css·vue.js·学习·html
询问QQ:4877392783 小时前
Comsol光子晶体仿真:复现子刊论文的奇妙之旅
html
杨超越luckly3 小时前
HTML应用指南:利用GET请求获取全国新东方门店位置信息
前端·数据库·arcgis·html·门店数据
微风粼粼4 小时前
html对接阿里云百炼AI大模型
人工智能·阿里云·html
明朝百晓生5 小时前
强化学习[page14]【chapter7】Temporal-Difference Learning (TD learning)
前端·html
亿牛云爬虫专家5 小时前
当数据开始“感知页面”
javascript·html·爬虫代理·代理ip·playwright·页面渲染·dom结构
胡gh16 小时前
css的臂膀,前端动效的利器,还是布局的“隐形陷阱”?
前端·css·html
十一.36619 小时前
103-105 添加删除记录
前端·javascript·html
大怪v1 天前
【Virtual World 005】上帝之眼
前端·javascript·html
0思必得01 天前
[Web自动化] HTML元素及DOM元素
前端·python·自动化·html·web自动化