某花顺爬虫逆向分析

目标网站:

aHR0cHM6Ly9xLjEwanFrYS5jb20uY24v

一、抓包分析

携带了cookie,每次请求的cookie都不一样,且不携带cookie不能成功返回数据

hook Cookie代码

javascript 复制代码
_cookie = document.cookie
Object.defineProperty(document, 'cookie', {
    get(){
        console.log('正在获取cookie,', _cookie)
        return _cookie
    },
    set(value){
        debugger;
        console.log('正在设置cookie,', value)
         if (value.indexOf("v") != -1) {
                debugger ;
            }
        _cookie = value
    }
})

新建代码,拷贝hook代码并保存运行

成功hook到cookie

向上跟栈,发现是update方法进行更新的

进入方法内部

方法所用到的S在前面就已经定义了,而且是个自执行方法

直接拷贝整个js文件到本地

定义全局变量GG,用于导出O方法

缺失环境

补环境代理

javascript 复制代码
function environment(obj) {
    return new Proxy(obj, {
        set(target, p, value, receiver){
            console.log('set:', p)
            return Reflect.set(...arguments)
        },
        get(target, p, receiver){
            console.log("get:", p);
            return target[p];
        }
    })
}
environment(window)

补上这些环境

生成的cookie

本地调用

文章仅提供技术交流学习,不可对目标服务器造成伤害

相关推荐
小白学大数据44 分钟前
Python爬虫常见陷阱:Ajax动态生成内容的URL去重与数据拼接
爬虫·python·ajax
Jonathan Star13 小时前
跨域处理的核心是解决浏览器的“同源策略”限制,主流方案
javascript·chrome·爬虫
Amazon数据采集15 小时前
深度解析:如何构建企业级电商数据采集架构?Pangolin API实战指南
爬虫·api
亿牛云爬虫专家1 天前
优化分布式采集的数据同步:一致性、去重与冲突解决的那些坑与招
分布式·爬虫·数据采集·爬虫代理·代理ip·数据同步·房地产
深蓝电商API2 天前
静态网页 vs 动态网页:爬虫该如何选择抓取策略?
爬虫
B站_计算机毕业设计之家2 天前
数据分析:Python懂车帝汽车数据分析可视化系统 爬虫(Django+Vue+销量分析 源码+文档)✅
大数据·爬虫·python·数据分析·汽车·可视化·懂车帝
孤狼warrior2 天前
爬虫+卷积神经网络项目实战解析——对图像狗的识别分类
人工智能·爬虫·神经网络·cnn·卷积神经网络
嫂子的姐夫3 天前
11-py调用js
javascript·爬虫·python·网络爬虫·爬山算法
kunge1v53 天前
学习爬虫第五天:自动化爬虫
爬虫·python·自动化
楼田莉子4 天前
python学习:爬虫+项目测试
后端·爬虫·python·学习