【简单】 猿人学web第一届 第3题 罗生门

请求逻辑分析

数据接口为https://match.yuanrenxue.cn/api/match/3?page=1

这一题的 请求参数 与 cookie 都没有加密参数

每次请求数据接口前都会请求 jssm 接口

requests 照着请求逻辑去请求,发现是失败的(数据接口返回包含 js标签 代码)

代码编写

这道题其实检测了请求头的顺序

打开 Fiddler 抓包,查看对应的请求头顺序
jssm 接口的请求头顺序

数据接口的请求头顺序
照着 Fiddler 请求头顺序去构造请求头,构造好之后请求还是一样的不通过
因为 Python 的字典是无序的,要想字典按照构造的顺序去请求,需要使用到 requests.session() 对象

python 复制代码
import requests

session = requests.session()

session 对象 cookie 设置

python 复制代码
session.cookies.set("sessionid", "你的sessionid值")

session 对象的 Headers 设置

python 复制代码
session.headers = {
	// 你构造的 headers 字典
}

session 对象发起请求

python 复制代码
// 请求携带的参数与 requests 对象一样
session.post(...)
session.get(...)

python 代码

python 复制代码
import requests

session = requests.session()
session.cookies.set("sessionid", "你的sessionid值")


def send_jsm():
    session.headers = {
        'Connection': 'keep-alive',
        'Content-Length': '0',
        'sec-ch-ua': '"Not)A;Brand";v="99", "Google Chrome";v="127", "Chromium";v="127"',
        'sec-ch-ua-mobile': '?0',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36',
        'sec-ch-ua-platform': '"Windows"',
        'Accept': '*/*',
        'Origin': 'https://match.yuanrenxue.cn',
        'Sec-Fetch-Site': 'same-origin',
        'Sec-Fetch-Mode': 'cors',
        'Sec-Fetch-Dest': 'empty',
        'Referer': 'https://match.yuanrenxue.cn/match/3',
        'Accept-Encoding': 'gzip, deflate, br, zstd',
        'Accept-Language': 'zh-CN,zh;q=0.9'
    }
    url = "https://match.yuanrenxue.cn/jssm"
    response = session.post(url)
    print(response)


def send_match3(page):
    session.headers = {
        'Connection': 'keep-alive',
        'sec-ch-ua': '"Not)A;Brand";v="99", "Google Chrome";v="127", "Chromium";v="127"',
        'Accept': 'application/json, text/javascript, */*; q=0.01',
        'X-Requested-With': 'XMLHttpRequest',
        'sec-ch-ua-mobile': '?0',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36',
        'sec-ch-ua-platform': '"Windows"',
        'Sec-Fetch-Site': 'same-origin',
        'Sec-Fetch-Mode': 'cors',
        'Sec-Fetch-Dest': 'empty',
        'Referer': 'https://match.yuanrenxue.cn/match/3',
        'Accept-Encoding': 'gzip, deflate, br, zstd',
        'Accept-Language': 'zh-CN,zh;q=0.9'
    }
    url = "https://match.yuanrenxue.cn/api/match/3"
    params = {
        "page": f'{page}'
    }
    response = session.get(url, params=params)
    print(response.text)


if __name__ == '__main__':
    for page in range(1, 6):
        send_jsm()
        send_match3(page)
相关推荐
gaolei_eit2 小时前
Vue3项目ES6转ES5,兼容低版本的硬件设备,React也
javascript·react.js·es6
一位搞嵌入式的 genius2 小时前
从 ES6 到 ESNext:JavaScript 现代语法全解析(含编译工具与实战)
前端·javascript·ecmascript·es6
子兮曰8 小时前
OpenClaw架构揭秘:178k stars的个人AI助手如何用Gateway模式统一控制12+通讯频道
前端·javascript·github
冷雨夜中漫步8 小时前
Python快速入门(6)——for/if/while语句
开发语言·经验分享·笔记·python
郝学胜-神的一滴9 小时前
深入解析Python字典的继承关系:从abc模块看设计之美
网络·数据结构·python·程序人生
百锦再9 小时前
Reactive编程入门:Project Reactor 深度指南
前端·javascript·python·react.js·django·前端框架·reactjs
百锦再9 小时前
React编程高级主题:测试代码
android·前端·javascript·react.js·前端框架·reactjs
颜酱10 小时前
图结构完全解析:从基础概念到遍历实现
javascript·后端·算法
喵手10 小时前
Python爬虫实战:旅游数据采集实战 - 携程&去哪儿酒店机票价格监控完整方案(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·采集结果csv导出·旅游数据采集·携程/去哪儿酒店机票价格监控
2501_9449347310 小时前
高职大数据技术专业,CDA和Python认证优先考哪个?
大数据·开发语言·python