python爬虫混肴DES案例:某影视大数据平台

声明:

该文章为学习使用,严禁用于商业用途和非法用途,违者后果自负,由此产生的一切后果均与作者无关

一、找出需要加密的参数
  1. js运行atob('aHR0cHM6Ly93d3cuZW5kYXRhLmNvbS5jbi9Cb3hPZmZpY2UvQk8vTW9udGgvb25lTW9udGguaHRtbA==') 拿到网址,F12打开调试工具,点击票房日期下拉筛选,找到 API/GetData.ashx 请求
  2. 分别切换headers、payload、preview,会发现 header、payload中没有经过特别处理的字段,preview 响应结果加密
  3. 鼠标右击该请求找到Copy>Copy as cUrl(cmd),打开网站:https://spidertools.cn/#/curl2Request,把拷贝好的curl转成python代码
  4. 新建yien.py文件,把代码复制到该文件内
二、定位参数加密位置
  1. 由于加密的header是动态生成的,显然使用关键字搜索无法定位到,直接切换到sources,添加XHR拦截 API/GetData.ashx
  2. 点击票房日期下拉筛选重新发送请求,看栈列表发现栈很少,可以先点点看,点到 PostApi 会发现请求的接口,且返回的结果在 sucess 回调函数中已经处理,打个断点
  3. 重新发送请求,点击跳过断点调试,直到看见请求的接口,会发现 e 是加密后的响应结果,经过 webInstace.shell 处理,鼠标悬浮到 webInstace.shell 点击蓝色部分,定位到该函数
  4. 进到该文件后,在if 和 else 中都打上断点,然后重新发送请求,点击跳过断点,找到刚才大的断点会发现进入了 else 断点,鼠标悬浮 _0x2246('0x25d', 'E&PI') 上会发现是 DES 算法
  5. 新建 yien.js,把整个代码复制到 yien.js
  6. 验证结果,把 e 输出到控制台,复制打印结果,修改 js 运行后,会发现报错
  7. 在控制台分别输出 !navigator 、!navigator_0x2246('0x26d', '0I#o') 会发现都是 false,找到 yien.js 的 2238 行修改js,再运行 js 发现解密成功
三、验证结果
  1. 修改 yien.py,运行该文件,会发现 UnicodeDecodeError 错误
  2. 解决 UnicodeDecodeError 错误,再次运行 yien.py 发现响应结果解密成功

相关推荐
Irissgwe25 分钟前
十、LangGraph能力详解:LangGraph 的其他特性
python·ai·langchain·langgraph
吴阿福|一人公司30 分钟前
类变量和实例变量的命名规范有哪些避坑点?
开发语言·python
zhoupenghui16839 分钟前
AI大模型应用部署之Flask框架使用
运维·python·docker·容器·flask·flask框架
ckjoker43 分钟前
手敲三Agent串行流水线,我发现了多Agent协作的隐形杀手
python·agent
稷下元歌43 分钟前
七天学会plc加机器视觉之AI 接入 外设模块开发全详细操作文档(全程配套视频按文档实操)
python·sql·qt·贪心算法·r语言·wpf·时序数据库
sky丶Mamba1 小时前
从入门到进阶:网络爬虫、反爬与反反爬技术全解析
爬虫
KaMeidebaby1 小时前
卡梅德生物技术快报|细胞周期检测抗原流式分析:参数调试、软件拟合与问题排查
网络·人工智能·python·网络协议·tcp/ip·算法·机器学习
zmzb01031 小时前
Python课后习题训练记录Day124
开发语言·python
geovindu1 小时前
python: Broadcast Pattern
开发语言·python·设计模式·广播模式
winfredzhang1 小时前
Python 实战:用 wxPython 写一个 MD5 文件查重清理工具
python·sqlite·json·wxpython·md5·预览·查重