某花顺爬虫逆向分析

目标网站:

aHR0cHM6Ly9xLjEwanFrYS5jb20uY24v

一、抓包分析

携带了cookie,每次请求的cookie都不一样,且不携带cookie不能成功返回数据

hook Cookie代码

javascript 复制代码
_cookie = document.cookie
Object.defineProperty(document, 'cookie', {
    get(){
        console.log('正在获取cookie,', _cookie)
        return _cookie
    },
    set(value){
        debugger;
        console.log('正在设置cookie,', value)
         if (value.indexOf("v") != -1) {
                debugger ;
            }
        _cookie = value
    }
})

新建代码,拷贝hook代码并保存运行

成功hook到cookie

向上跟栈,发现是update方法进行更新的

进入方法内部

方法所用到的S在前面就已经定义了,而且是个自执行方法

直接拷贝整个js文件到本地

定义全局变量GG,用于导出O方法

缺失环境

补环境代理

javascript 复制代码
function environment(obj) {
    return new Proxy(obj, {
        set(target, p, value, receiver){
            console.log('set:', p)
            return Reflect.set(...arguments)
        },
        get(target, p, receiver){
            console.log("get:", p);
            return target[p];
        }
    })
}
environment(window)

补上这些环境

生成的cookie

本地调用

文章仅提供技术交流学习,不可对目标服务器造成伤害

相关推荐
深蓝电商API13 小时前
爬虫任务调度系统:基于Celery的定时+触发式采集方案
爬虫
WL_Aurora16 小时前
Python爬虫实战(七):Selenium自动化采集苏宁易购商品数据
爬虫·python·selenium
Python私教1 天前
Playwright MCP 用 a11y 树抓页面:比全量 DOM 省 token 的采集 Agent
爬虫
枫叶林FYL1 天前
项目九:异步高性能爬虫与数据采集中枢 —— 基于 Crawl<sub>4</sub>AI 与 Playwright 的现代化数据采集平台 项目总览
爬虫·python·深度学习·wpf
上海云盾-小余1 天前
恶意爬虫精准拦截:网站流量净化与资源守护方案
网络·爬虫·web安全
小白学大数据2 天前
深度探索:Python 爬虫实现豆瓣音乐全站采集
开发语言·爬虫·python·数据分析
烟雨江南aabb2 天前
Python第六弹:python爬虫篇:什么是爬虫
开发语言·爬虫·python
深蓝电商API2 天前
分布式电商爬虫架构:Scrapy-Redis+消息队列的集群部署
分布式·爬虫·架构
WL_Aurora2 天前
Python爬虫实战(六):新发地蔬菜价格数据采集.
爬虫·python
盲敲代码的阿豪2 天前
Python 入门基础教程(爬虫前置版)
开发语言·爬虫·python