Python爬虫——解析_jsonpath解析淘票票网站

jsonpath简单解析淘票票网站,获取城市名称

代码如下:

python 复制代码
import urllib.request
import json
import jsonpath

url = 'https://dianying.taobao.com/cityAction.json?activityId&_ksTS=1691330599914_108&jsoncallback=jsonp109&action=cityAction&n_s=new&event_submit_doGetAllRegion=true'

headers = {
    'accept': '',
    'accept-language': '',
    'bx-v': '',
    'cookie': '',
    'referer': '',
    'sec-ch-ua': '',
    'sec-ch-ua-mobile': '',
    'sec-ch-ua-platform': '',
    'sec-fetch-dest': '',
    'sec-fetch-mode': '',
    'sec-fetch-site': '',
    'user-agent': '',
    'x-requested-with': ''
}

# 请求对象的定制
request = urllib.request.Request(url, headers=headers)
# 模拟浏览器发送请求
response = urllib.request.urlopen(request)
# 获取响应数据
content = response.read().decode('utf-8')
# split 切割
content = content.split('(')[1].split(')')[0]

# 保存本地
with open('files/taopiaopiao.json', 'w', encoding='utf-8') as fp:
    fp.write(content)

# obj = json.loads(content)
obj = json.load(open('files/taopiaopiao.json', 'r', encoding='utf-8'))
# 获取地区名称
city_name = jsonpath.jsonpath(obj, '$..regionName')
print(city_name)
相关推荐
MediaTea26 分钟前
Python:可迭代对象(对象语义角色)
开发语言·python
skywalk81631 小时前
Diffusers 库介绍,它支持LTX-2模型
python
一个处女座的程序猿O(∩_∩)O2 小时前
Python函数参数*args和**kwargs完全指南:从入门到精通
开发语言·python
好家伙VCC2 小时前
**发散创新:编译器优化实战——从LLVM IR到性能飞跃的奇妙旅程**
java·开发语言·python·算法
大尚来也2 小时前
Python 中使用 ezdxf:轻松读写 DXF 文件的完整指南
开发语言·python
小雨中_2 小时前
2.6 时序差分方法(Temporal Difference, TD)
人工智能·python·深度学习·机器学习·自然语言处理
@zulnger3 小时前
单元测试框架 —— unittest
python·单元测试
apcipot_rain3 小时前
原神“十盒半价”问题的兹白式建模分析
python·数学·算法·函数·数据科学·原神·数列
喵手3 小时前
Python爬虫实战:舆情语料项目 - 从新闻抓取到文本挖掘的完整实战(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·舆论语料项目·新闻抓取到文本挖掘·爬虫实战采集舆论语料
坚持就完事了3 小时前
Python的类型注解
开发语言·python