某花顺爬虫逆向分析

目标网站:

aHR0cHM6Ly9xLjEwanFrYS5jb20uY24v

一、抓包分析

携带了cookie,每次请求的cookie都不一样,且不携带cookie不能成功返回数据

hook Cookie代码

javascript 复制代码
_cookie = document.cookie
Object.defineProperty(document, 'cookie', {
    get(){
        console.log('正在获取cookie,', _cookie)
        return _cookie
    },
    set(value){
        debugger;
        console.log('正在设置cookie,', value)
         if (value.indexOf("v") != -1) {
                debugger ;
            }
        _cookie = value
    }
})

新建代码,拷贝hook代码并保存运行

成功hook到cookie

向上跟栈,发现是update方法进行更新的

进入方法内部

方法所用到的S在前面就已经定义了,而且是个自执行方法

直接拷贝整个js文件到本地

定义全局变量GG,用于导出O方法

缺失环境

补环境代理

javascript 复制代码
function environment(obj) {
    return new Proxy(obj, {
        set(target, p, value, receiver){
            console.log('set:', p)
            return Reflect.set(...arguments)
        },
        get(target, p, receiver){
            console.log("get:", p);
            return target[p];
        }
    })
}
environment(window)

补上这些环境

生成的cookie

本地调用

文章仅提供技术交流学习,不可对目标服务器造成伤害

相关推荐
ccchen88810 小时前
Discuz X5.0 免登录采集发布插件 - 免费使用指南
经验分享·爬虫·火车头·disucz论坛采集发布·自动采集发布
小白学大数据12 小时前
Python 爬虫爬取应用商店数据:请求构造与数据解析
前端·爬虫·python·数据分析
深蓝电商API14 小时前
电商网站滑块验证码破解:OpenCV图像识别+轨迹模拟方案
爬虫·滑块验证码
Land032916 小时前
指纹浏览器自动化集成方案|多浏览器RPA适配实战记录
运维·人工智能·爬虫·python·selenium·自动化·rpa
深蓝电商API17 小时前
淘宝反爬升级应对:从Selenium到Playwright的迁移实践
爬虫·淘宝
WL_Aurora19 小时前
Python爬虫实战(二):百度热搜榜单爬取
爬虫·python
Marvel__Dead20 小时前
微调 Gemma 4 识别腾讯天御全系列验证码【解决方案-一个模型识别 滑块|文字点选|图标点选|空间点选】
人工智能·爬虫·python·验证码识别·ai 大模型
跨境数据猎手21 小时前
反向海淘代购集运系统三种搭建路径对比:自研、开源二开、SaaS
爬虫·系统架构·开源
川冰ICE1 天前
Python爬虫实战⑲|Pandas数据合并与重塑,多数据源整合
爬虫·python·pandas
feasibility.1 天前
反爬十层妖塔:现代爬虫攻防的立体战争
爬虫·python·科技·scrapy·rust·go·硬件