【Python第三方库】lxml 解析器和xpath路径语言

1.lxml是做什么的

是xml/html的解析器,主要是用来解析和提取html/xml数据

2.lxml语法
  • 使用etree.HTML(html字符串),将字符串转换为Element对象
  • 通过使用Element对象.xpath(语法)提取信息,返回的是一个列表的内存地址,需要通过使用索引获取信息
3.Xpath是什么

在HTML/xml文档中查找信息的语言,使用路径表达式来选取html/xml文档中的节点/节点集

4.常用节点选取工具
  • 谷歌浏览器里面使用XPath Helper
5.XPath 语法
节点选择语法​​​​​​​
复制代码
|----------|----------------------------|----------------------------------------------------------------------------------------------------------------|
| **节点分类** | **概念**                     | **举例**                                                                                                         |
| /        | 从根节点取                      | /html/head/div 获取的html节点下的head节点下所有的div节点内容信息                                                                  |
| //       | 从匹配选择的当前节点选择文档中的节点,不考虑节点位置 | //div 获取全html文档内的所有div节点的内容信息,返回列表                                                                             |
| .        | 选取当前节点                     |                                                                                                                |
| ..       | 选取当前节点的父节点                 |                                                                                                                |
| @        | 选取指定节点内的属性                 | //div\[@class="map"\] 获取全文档下的div节点中属性class的值为map的节点内容信息,返回的是列表 //img\[@id="s_log"\]/@scid获取img标签的id为s_log的scid |
节点修饰语法
相关推荐
hyhrosewind36 分钟前
Python函数基础:说明文档(多行注释),函数嵌套调用,变量作用域(局部,全局,global关键字),综合案例
python·变量作用域·函数说明文档(多行注释)·函数嵌套调用·局部变量和全局变量·函数内修改全局变量·global关键字
一点.点1 小时前
李沐动手深度学习(pycharm中运行笔记)——04.数据预处理
pytorch·笔记·python·深度学习·pycharm·动手深度学习
一点.点1 小时前
李沐动手深度学习(pycharm中运行笔记)——07.自动求导
pytorch·笔记·python·深度学习·pycharm·动手深度学习
大霸王龙2 小时前
Python对比两张CAD图并标记差异的解决方案
python·opencv·计算机视觉
萧鼎3 小时前
PDFMathTranslate:让数学公式在PDF翻译中不再痛苦
python·pdf
@_猿来如此3 小时前
Django 实现电影推荐系统:从搭建到功能完善(附源码)
数据库·后端·python·django
Python×CATIA工业智造3 小时前
爬虫技术入门:基本原理、数据抓取与动态页面处理
爬虫·python·pycharm
fmdpenny4 小时前
用python写一个相机选型的简易程序
开发语言·python·数码相机
敲敲敲-敲代码4 小时前
【PyCharm- Python- ArcGIS】:安装一个和 ArcGIS 不冲突的独立 Python让PyCharm 使用 (解决全过程记录)
python·arcgis·pycharm
猿榜编程4 小时前
python基础-requests结合AI实现自动化数据抓取
开发语言·python·自动化