Python爬虫——解析_jsonpath

jsonpath的安装

base 复制代码
pip install jsonpath

jsonpath的使用:

python 复制代码
obj = json.load(open('json文件', 'r', encoding='utf-8'))
ret = jsonpath.jsonpath(obj, 'jsonpath语法')

json文件:

json 复制代码
{ "store": {
    "book": [
      { "category": "末世",
        "author": "晨星LL",
        "title": "这游戏也太真实了",
        "price": 8.95
      },
      { "category": "玄幻",
        "author": "辰东",
        "title": "遮天",
        "price": 12.99
      },
      { "category": "御兽",
        "author": "清泉流响",
        "title": "不科学御兽",
        "isbn": "0-553-21311-3",
        "price": 8.99
      },
      { "category": "科幻",
        "author": "我吃西红柿",
        "title": "吞噬星空",
        "isbn": "0-395-19395-8",
        "price": 22.99
      }
    ],
    "bicycle": {
      "author": "车厂",
      "color": "blue",
      "price": 19.95
    }
  }
}
  • 书店所有书的作者
python 复制代码
# *代表全部   可以根据下标来获取第几本书
book_list = jsonpath.jsonpath(obj, '$.store.book[*].author')
print(book_list)
  • 所有的作者
python 复制代码
book_list = jsonpath.jsonpath(obj, '$..author')
print(book_list)
  • store下面所有的元素
python 复制代码
book_list = jsonpath.jsonpath(obj, '$.store[*]')
print(book_list)
  • store里面所有东西的price
python 复制代码
book_list = jsonpath.jsonpath(obj, '$.store..price')
print(book_list)
  • 第三本书
python 复制代码
book_list = jsonpath.jsonpath(obj, '$..book[2]')
print(book_list)
  • 最后一本书
python 复制代码
book_list = jsonpath.jsonpath(obj, '$..book[(@.length-1)]')
print(book_list)
  • 前两本书
python 复制代码
# 两种写法
book_list = jsonpath.jsonpath(obj, '$..book[0,1]')
book_list = jsonpath.jsonpath(obj, '$..book[:2]')
print(book_list)
  • 条件过滤需要在()的前面添加一个?
  • 过滤出所有包含isbn的书
python 复制代码
book_list = jsonpath.jsonpath(obj, '$..book[?(@.isbn)]')
print(book_list)
  • 哪本书超过了10块钱
python 复制代码
book_list = jsonpath.jsonpath(obj, '$..book[?(@.price>10)]')
print(book_list)

参考:https://blog.csdn.net/Obstinate_L/article/details/125294971

相关推荐
海边的梦几秒前
爬虫对抗:ZLibrary反爬机制实战分析 技术文章大纲
爬虫
进击的雷神3 分钟前
主办方过滤、展位号模糊提取、多层级官网爬取、缅文编码解码——缅甸塑料展爬虫四大技术难关攻克纪实
网络·爬虫·python
core5123 分钟前
多源车辆数据打通实战指南:从12123接口、爬虫获取电动自行车车辆信息到备案数据推送六合一平台
爬虫·电动自行车·12123·车辆信息·六合一·备案数据
winfredzhang9 分钟前
用 Python + DeepSeek AI 构建文件批量重命名与智能管理工具
python·api·重命名·预览·解压·deepseek
西西弗Sisyphus16 分钟前
Python 中__pycache__文件夹
python
qingcyb21 分钟前
重复 id 对应的多个对象
开发语言·python
mingshili22 分钟前
[python] asyncio常规操作记录
python·async
chushiyunen24 分钟前
python edge-tts实现tts文本转语音、音频
数据库·python·音视频
嫂子的姐夫31 分钟前
040-spiderbuf第C8题
javascript·爬虫·python·js逆向·逆向
江上清风山间明月34 分钟前
python将dtso文件转换成dtbo文件
python·dts·dtso