关于爬虫中的hook(defineProperty,hook cookies, hook载荷数据,hookXHR)

关于爬虫中的hook:

defineProperty
js 复制代码
var people = {
    age: 19,
};
var  count=20;
console.log(people.age)
// 参数:对象 属性名字 函数
Object.defineProperty(people, 'age', {
    get: function () {
        console.log('获取值!');
        return count;
    },
    // set: function (val) {
    //     console.log('设置值!');
    //     count = val + 1;
    // },
});
console.log(people.age) 

我们会发现,调用这个对象的属性的时候会自动调用那个函数,而且并没有直接输出我们的age属性值,age属性值被拦截了。

我们再看下面这个方法:

js 复制代码
var people = {
    age: 19,
};
var  count=20;
// 参数:对象 属性名字
Object.defineProperty(people, 'age', {
    get: function () {
        console.log('获取值!');
        return count;
    },
    set: function (val) {
        console.log('你正在设置一个值');
        count = val + 1;
    },
});
console.log(people.age)
people.age = 50
console.log(people.age)

奇怪吧,原来设置值有的时候可以不对自己进行设置值,设置值可以有输出语句。

hook cookies

网站:

js 复制代码
import base64

# 解码
result = base64.b64decode('aHR0cHM6Ly9xLjEwanFrYS5jb20uY24v'.encode('utf-8'))
print(result)

我们会发现这个每一页数据的cookies的v都在发生变化,我们需要找到相应的js文件。

js 复制代码
(function () {
  'use strict';
  var cookieTemp = '';
  Object.defineProperty(document, 'cookie', {
    set: function (val) {
      if (val.indexOf('__dfp') != -1) {// 存在为0 
        debugger;
      }
      console.log('Hook捕获到cookie设置->', val);
      cookieTemp = val;
      return val;//确保其正确返回
    },
    get: function () {
      return cookieTemp;
    },
  });
})();

获得cookie的时候,记着把cookie清空。

set 是我们hook的代码,所以向下找。

然后依次向下找,n的值就是cookie中v的值。

hook载荷数据

js代码中一定有JSON.stringify,将json对象转化为json字符串

这样的形式可以使用如下hook代码。

js 复制代码
(function() {
    var stringify = JSON.stringify;
    JSON.stringify = function(params) {
        console.log("接收到的数据是 ------> ", params);
        debugger;
        return stringify(params);//正常返回
    }
})();

也可以对其进行拦截:

hookXHR:

网站:

py 复制代码
import base64
# 解码
result = base64.b64decode('aHR0cHM6Ly93d3cucWltYWkuY24v'.encode('utf-8'))
print(result)


我们会发现网址里面的数据被加密了。

js 复制代码
(function () {
    var open = window.XMLHttpRequest.prototype.open;//重构
    window.XMLHttpRequest.prototype.open = function (method, url, async) { // 方式 网址 是否异步
        if (url.indexOf("login") != -1) { //找到了应该是0 
            debugger;
        }
        // arguments 接受传递的参数,得到的是数组 
        return open.apply(this, arguments);
    };
})();
相关推荐
崔庆才丨静觅7 小时前
hCaptcha 验证码图像识别 API 对接教程
前端
passerby60617 小时前
完成前端时间处理的另一块版图
前端·github·web components
掘了7 小时前
「2025 年终总结」在所有失去的人中,我最怀念我自己
前端·后端·年终总结
崔庆才丨静觅7 小时前
实用免费的 Short URL 短链接 API 对接说明
前端
崔庆才丨静觅8 小时前
5分钟快速搭建 AI 平台并用它赚钱!
前端
崔庆才丨静觅8 小时前
比官方便宜一半以上!Midjourney API 申请及使用
前端
Moment8 小时前
富文本编辑器在 AI 时代为什么这么受欢迎
前端·javascript·后端
崔庆才丨静觅9 小时前
刷屏全网的“nano-banana”API接入指南!0.1元/张量产高清创意图,开发者必藏
前端
剪刀石头布啊9 小时前
jwt介绍
前端
爱敲代码的小鱼9 小时前
AJAX(异步交互的技术来实现从服务端中获取数据):
前端·javascript·ajax