Python爬虫——解析_jsonpath解析淘票票网站

jsonpath简单解析淘票票网站,获取城市名称

代码如下:

python 复制代码
import urllib.request
import json
import jsonpath

url = 'https://dianying.taobao.com/cityAction.json?activityId&_ksTS=1691330599914_108&jsoncallback=jsonp109&action=cityAction&n_s=new&event_submit_doGetAllRegion=true'

headers = {
    'accept': '',
    'accept-language': '',
    'bx-v': '',
    'cookie': '',
    'referer': '',
    'sec-ch-ua': '',
    'sec-ch-ua-mobile': '',
    'sec-ch-ua-platform': '',
    'sec-fetch-dest': '',
    'sec-fetch-mode': '',
    'sec-fetch-site': '',
    'user-agent': '',
    'x-requested-with': ''
}

# 请求对象的定制
request = urllib.request.Request(url, headers=headers)
# 模拟浏览器发送请求
response = urllib.request.urlopen(request)
# 获取响应数据
content = response.read().decode('utf-8')
# split 切割
content = content.split('(')[1].split(')')[0]

# 保存本地
with open('files/taopiaopiao.json', 'w', encoding='utf-8') as fp:
    fp.write(content)

# obj = json.loads(content)
obj = json.load(open('files/taopiaopiao.json', 'r', encoding='utf-8'))
# 获取地区名称
city_name = jsonpath.jsonpath(obj, '$..regionName')
print(city_name)
相关推荐
用户8356290780513 小时前
使用 Python 操作 Word 内容控件
后端·python
码云骑士4 小时前
32-慢查询排查全流程(下)-索引优化实战与最左前缀原则
python
隔窗听雨眠5 小时前
大模型加爬虫上篇:技术融合与架构革新
爬虫·架构
闵孚龙5 小时前
《PyTorch 深度修炼》Dataset 和 DataLoader:数据如何喂给模型
人工智能·pytorch·python
goldenrolan5 小时前
A公司物料替代测试系统 v1.7:从需求到 exe/apk 的 AI 辅助全链路实践
android·自动化测试·软件测试·python·ai
菜板春5 小时前
jupyter入门-手册-特征探索
python·jupyter
Metaphor6925 小时前
使用 Python 将 PDF 转换为 HTML
python·pdf·html
极光代码工作室5 小时前
基于数据仓库的电商数据分析平台
大数据·hadoop·python·spark·数据可视化
开发小能手-roy6 小时前
StringBuilder vs StringBuffer:2024年还需要线程安全字符串吗?
开发语言·python·安全