Python爬虫——解析_jsonpath解析淘票票网站

jsonpath简单解析淘票票网站,获取城市名称

代码如下:

python 复制代码
import urllib.request
import json
import jsonpath

url = 'https://dianying.taobao.com/cityAction.json?activityId&_ksTS=1691330599914_108&jsoncallback=jsonp109&action=cityAction&n_s=new&event_submit_doGetAllRegion=true'

headers = {
    'accept': '',
    'accept-language': '',
    'bx-v': '',
    'cookie': '',
    'referer': '',
    'sec-ch-ua': '',
    'sec-ch-ua-mobile': '',
    'sec-ch-ua-platform': '',
    'sec-fetch-dest': '',
    'sec-fetch-mode': '',
    'sec-fetch-site': '',
    'user-agent': '',
    'x-requested-with': ''
}

# 请求对象的定制
request = urllib.request.Request(url, headers=headers)
# 模拟浏览器发送请求
response = urllib.request.urlopen(request)
# 获取响应数据
content = response.read().decode('utf-8')
# split 切割
content = content.split('(')[1].split(')')[0]

# 保存本地
with open('files/taopiaopiao.json', 'w', encoding='utf-8') as fp:
    fp.write(content)

# obj = json.loads(content)
obj = json.load(open('files/taopiaopiao.json', 'r', encoding='utf-8'))
# 获取地区名称
city_name = jsonpath.jsonpath(obj, '$..regionName')
print(city_name)
相关推荐
treesforest33 分钟前
机房IP是什么?有什么危害?如何识别?
网络·数据库·python·网络协议·tcp/ip·网络安全
咕白m6251 小时前
Excel 工作表名称读取(Python 实现)
后端·python
godspeed_lucip2 小时前
LLM和Agent——专题5: LLM Ops 入门(1)
人工智能·python
l1t2 小时前
DeepSeek总结的使用实体-组件-系统和基于存在性处理进行Python编程7-8
开发语言·python
俊哥工具2 小时前
无广告免费壁纸工具,手机电脑壁纸随心更换
python·智能手机·django·计算机外设·virtualenv·pygame
scan7242 小时前
大模型调用多个工具
python
暴躁小师兄数据学院2 小时前
【AI大模型应用开发工程师特训笔记】第04讲(第 2 章):Python 项目企业级开发规范
人工智能·笔记·python
小江的记录本3 小时前
【JVM虚拟机】垃圾回收GC:垃圾判定算法:引用计数法、可达性分析算法(附《思维导图》+《面试高频考点清单》)
java·jvm·后端·python·算法·spring·面试
清水白石0083 小时前
构建企业级 Python 服务:配置、日志、指标与追踪的稳健之道
开发语言·python·elasticsearch
happymaker06264 小时前
SpringBoot使用Thymeleaf模板引擎,前端的基本语法
开发语言·python