python爬虫中json和xml字符串的xPath和jsonpath过滤语法区别对比

参考博客

两种语法结构作用

为了处理从网络请求返回的网页源码中得到自己想要的数据

首先了解两种库处理的对象语法

jsonpath处理的是json语法格式的字符串

**json(JavaScript Object Notation)**字符串的语法参考

**类似于下面的格式,以键值的形式,其中值可以是字符串,数值或中括号包括的数组形式。**但最小的元素表示还是以键值的i形式。

xpath处理的是xml字符串

xml(Extensible Markup Language)可扩展标记语言,这种语言注重是对数据传输而不是显示
实例语法参考,

xml文件和html文件的不同

主要还是标签和功能的不同 ,从标签定义看 ,HTML中的标签是定义好的,而xml是可以自己定义不同的标签;从功能重点上看,html为了更好的显示,让用户看;而xml为了更好的数据检索传递。

两种分析模块的语法

jsonpath模块

代码参考

json 复制代码
{
  "store":{
    "book":[
      {
        "category":"reference",
        "author":"Nigel Rees",
        "title":"Sayings of the Century",
        "price":8.95
      },
      {
        "category":"fiction",
        "author":"J. R. R. Tolkien",
        "title":"The Lord of the Rings",
        "isbn":"0-395-19395-8",
        "price":22.99
      }
    ],
    "bicycle":{
      "color":"red",
      "price":19.95
    }
  }
}


实例输出分析筛选规则

jsonpath最终返回的都是json字符串键值对中 的键对应的值,并使用列表包括,最终返回的数据类型是列表

xpath语法


实例代码参考

两种语法的对比

参考文档

相关推荐
jiayong2315 小时前
02 创建虚拟环境
python
NiceCloud喜云15 小时前
Claude Code Routines 实战:三种触发器跑通云端自动化编码
android·运维·数据库·人工智能·自动化·json·飞书
旺仔来了15 小时前
不联网的Linux下部署python环境
linux·开发语言·python
小江的记录本15 小时前
【JVM虚拟机】垃圾回收GC:垃圾回收算法:标记-清除、标记-复制、标记-整理、分代收集(附《思维导图》+《面试高频考点清单》)
java·jvm·后端·python·算法·安全·面试
IP搭子来一个15 小时前
爬虫采集大量返回 403、429,到底卡在哪一环?
网络·爬虫·python
海兰15 小时前
Kibana Dashboard as Code:Elastic 9.4 如何用 Terraform 和类型化 API 终结“JSON 垃圾袋“
云原生·json·terraform
deepin_sir15 小时前
06 综合对比与实战选型——到底该用哪个?
python
小江的记录本16 小时前
【JVM虚拟机】垃圾回收GC:垃圾收集器:G1:Region分区、Mixed GC、回收流程、适用场景(高频)(附《思维导图》+《面试高频考点清单》)
java·jvm·后端·python·spring·spring cloud·面试
智研数智工坊16 小时前
FastAPI+uv+Jinja2+Nuitka 通用Web桌面框架搭建教程|从零搭建可打包迭代的Python开发底座
python·fastapi·uv·nuitka·jinja2·桌面应用开发
Ulyanov16 小时前
用声明式语法重新定义Python桌面UI:QML+PySide6现代开发入门(一)
开发语言·python·算法·ui·系统仿真·雷达电子对抗仿真