python爬虫中json和xml字符串的xPath和jsonpath过滤语法区别对比

参考博客

两种语法结构作用

为了处理从网络请求返回的网页源码中得到自己想要的数据

首先了解两种库处理的对象语法

jsonpath处理的是json语法格式的字符串

**json(JavaScript Object Notation)**字符串的语法参考

**类似于下面的格式,以键值的形式,其中值可以是字符串,数值或中括号包括的数组形式。**但最小的元素表示还是以键值的i形式。

xpath处理的是xml字符串

xml(Extensible Markup Language)可扩展标记语言,这种语言注重是对数据传输而不是显示
实例语法参考,

xml文件和html文件的不同

主要还是标签和功能的不同 ,从标签定义看 ,HTML中的标签是定义好的,而xml是可以自己定义不同的标签;从功能重点上看,html为了更好的显示,让用户看;而xml为了更好的数据检索传递。

两种分析模块的语法

jsonpath模块

代码参考

json 复制代码
{
  "store":{
    "book":[
      {
        "category":"reference",
        "author":"Nigel Rees",
        "title":"Sayings of the Century",
        "price":8.95
      },
      {
        "category":"fiction",
        "author":"J. R. R. Tolkien",
        "title":"The Lord of the Rings",
        "isbn":"0-395-19395-8",
        "price":22.99
      }
    ],
    "bicycle":{
      "color":"red",
      "price":19.95
    }
  }
}


实例输出分析筛选规则

jsonpath最终返回的都是json字符串键值对中 的键对应的值,并使用列表包括,最终返回的数据类型是列表

xpath语法


实例代码参考

两种语法的对比

参考文档

相关推荐
Autumn729912 分钟前
【系统重装】PYTHON 入门——速通版
开发语言·python·conda·cuda
ding_zhikai12 分钟前
【Web应用开发笔记】Django笔记3:模版的用法-实现一个简单的网页
笔记·后端·python·django
FL162386312916 分钟前
基于yolov11+django+deepseek的血液细胞红白细胞血小板检测系统带登录界面python源码+onnx模型+精美web界面
python·yolo·django
啊阿狸不会拉杆30 分钟前
《计算机视觉:模型、学习和推理》第 9 章-分类模型
人工智能·python·学习·算法·机器学习·计算机视觉·分类
Dxy123931021631 分钟前
DataFrame缺失值处理:完整指南与实战技巧
python·pandas·dataframe
geovindu35 分钟前
python: Visitor Pattern
python·设计模式·访问者模式
wanderist.40 分钟前
从 TCP 到 JSON:一次 FastAPI + LLM 生产环境 “Unexpected end of JSON input” 的底层剖析
tcp/ip·json·fastapi
哈里谢顿1 小时前
TCP 线程池连接耗尽故障排查指导
python
zhaoyin19942 小时前
关于文件读取中使用的斜杠问题
python
勇往直前plus3 小时前
从文件到屏幕:Python/java 字符编码、解码、文本处理的底层逻辑解析
java·开发语言·python