XPath:学习使用XPath语法提取HTML/XML文档中的数据使用语法

以下是一些XPath语法示例,用于提取HTML/XML文档中的数据:

  1. 选择元素:
    • 选择所有p元素: //p
    • 选择根元素: /
  2. 属性匹配:
    • 选择class属性为"example"的div元素: //div[@class='example']
  3. 文本内容提取:
    • 提取所有a元素的文本内容: //a/text()
    • 提取第一个p元素的文本内容: //p[1]/text()
  4. 使用逻辑运算符:
    • 选择同时具有class属性为"example"且id属性为"heading"的元素: //*[@class='example' and @id='heading']
  5. 使用位置谓词:
    • 选择前三个li元素: //li[position() <= 3]
    • 选择最后一个p元素: //p[last()]
  6. 使用通配符:
    • 选择所有元素: //*
    • 选择div元素下的任意子元素: //div/*
  7. 使用轴:
    • 选择div元素的所有祖先元素: //div/ancestor::*
    • 选择span元素之后的所有兄弟元素: //span/following-sibling::*

以上只是XPath语法的一些示例,您可以根据实际需求进行组合和调整。使用XPath语法,您能够更精确地选择和提取HTML/XML文档中的数据。

本文由mdnice多平台发布

相关推荐
a11177618 分钟前
可视化角色权限配置页面(html 开源)
前端·开源·html
ZC跨境爬虫10 小时前
跟着MDN学HTML_day_48:(Node接口)
前端·javascript·ui·html·音视频
PieroPc11 小时前
CAMWATCH — 局域网摄像头监控系统 Fastapi + html
前端·python·html·fastapi·监控
向阳而生66017 小时前
iframe 使用全解析:语法、避坑与实操指南(新手友好)
html
a11177620 小时前
细胞结构实验室(react 开源)
前端·javascript·开源·html
产品经理爱开发1 天前
老师用AI开发的HTML教具如何在线托管访问
前端·html·ai编程·持续部署·源代码管理
ZC跨境爬虫1 天前
跟着MDN学HTML_day_47:(Document接口)
前端·javascript·ui·html·ecmascript·音视频
bbq粉刷匠1 天前
了解HTML、CSS与JavaScript
javascript·css·html
Python大数据分析@1 天前
说说Markdown为什么不会被HTML取代
前端·html
qcx231 天前
开源首发:DocCenter — AI 时代的 HTML工作台深度解析
人工智能·开源·html