042-spiderbuf第C7题

案例网址:spiderbuf第C7题

接口+加密参数

这里有个无限debugger,hook一下直接过掉:

抓到数据包:

复制bash,用py验证一下看看那些参数需要逆向:

ok,这四个参数都需要逆向,开干:

找加密位置

启动器进去打断点:

刷新网页,通过跟变量一步步找到data里三个加密参数位置:

找到加密位置,稍做分析:

这里总结一下:timeStamp是十位之间戳,key是通过随机数取整后从characters中取字母,token应该是从主页面源代码中CSS匹配的token(#token是id选择器)这三个基本上明白了,但是还有一个cookie参数需要逆向,我们找一下:

远在天边近在眼前,看名字像md5加密,我们试一试:

ok,标准md5,参数就是刚才几个参数拼接,下面开始复现吧:

加密逻辑复现

导入crypto-js库然后扣下来网页的代码,token先写死看看能不能出值:

出值了,大家也可以将时间戳和token以及key和网页写的一样然后运行看看结果一样不,这里就不展示了,然后我们看看token是否真是首页获取的:

还真是,那就用DrissionPage拿一下token

py调用

python 复制代码
import execjs
import requests
from DrissionPage import ChromiumPage, ChromiumOptions
from DrissionPage.common import By

def get_token():
    # 1. 创建配置对象,启用无头模式
    co = ChromiumOptions()
    co.headless()  # 启用无头模式
    dp = ChromiumPage(addr_or_opts=co)
    dp.get('https://www.spiderbuf.cn/web-scraping-practice/scraper-practice-c07')
    # time.sleep(1.5)
    token_ele = dp.ele((By.XPATH, '//main/div[2]/input'))
    token_data = token_ele.attr('value')
    dp.quit()
    return token_data

def get_params(token):
    with open('xxx.js', 'r', encoding='utf-8') as f:
        js_code = f.read()
    js_code = execjs.compile(js_code)
    return js_code.call('get_coo_data', token)

def get_data(_asd2sdf99, js_data):
    cookies = {
        '_asd2sdf99': _asd2sdf99,
    }
    headers = {
        'origin': 'https://www.spiderbuf.cn',
        'referer': 'https://www.spiderbuf.cn/web-scraping-practice/scraper-practice-c07',
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/145.0.0.0 Safari/537.36 Edg/145.0.0.0',
    }

    data = js_data

    response = requests.post(
        'https://www.spiderbuf.cn/web-scraping-practice/scraper-practice-c07',
        cookies=cookies,
        headers=headers,
        data=data,
    )
    return response.text

def main():
    token = get_token()
    params = get_params(token)
    return get_data(params['_asd2sdf99'], params['_0x1c3ba0'])

if __name__ == '__main__':
    print(main())

result:

拿下

小结

文章比较简单,小白可以先自行练习一下,如有问题请及时提出加油加油

相关推荐
2403_835568472 小时前
自然语言处理(NLP)入门:使用NLTK和Spacy
jvm·数据库·python
剑穗挂着新流苏3122 小时前
Pytorch加载数据
python·深度学习·transformer
qq_452396232 小时前
【Python × AI】多智能体协作:从 AutoGPT 到 CrewAI 的组织进化论
大数据·人工智能·python·ai
guhy fighting2 小时前
pycharm 切换版本和窗口cmd看到的版本不一致问题解决
ide·python·pycharm
今儿敲了吗2 小时前
python基础学习笔记第六章——函数进阶
笔记·python·学习
码码哈哈0.03 小时前
LangChain 快速入门(从0到可用)
开发语言·python·langchain
2301_776508723 小时前
用Python生成艺术:分形与算法绘图
jvm·数据库·python
熊文豪3 小时前
Java 入门指南
开发语言·python
带娃的IT创业者3 小时前
WeClaw 日志分析实战:如何从海量日志中快速定位根因?
运维·python·websocket·jenkins·fastapi·架构设计·实时通信