爬虫&逆向--Day13&Day14--JS逆向核心案例(响应入口定位、JS逆向响应解密、JS逆向请求加密)

一、JS逆向课程介绍

复制代码
逆向核心案例
    -- JS逆向流程(原理)
    --请求加密
    --响应解密  
逆向基础案例
    --扣JS
    --webpack
    --补环境
      -- 瑞数
      -- 原型链
    -- 滑块
    -- Akamai
    -- JSVMP
学习方法:
    复盘课上项目

准备链接:
复制代码
  案例链接:https://ggzyfw.fujian.gov.cn/business/list/
    -- 为了保持环境一致,避免出现不必要的问题,建议使用Google浏览器无痕模式

  破解网站:https://www.swhysc.com/swhysc/news/company

  快速生成爬虫代码:https://curlconverter.com/
    -- 既是根据Ajax发送的请求链接的基本信息请求参数,请求体,请求头等,快速生成爬虫代码

  画图网站:https://excalidraw.com/
    --可以根据需要画出结构图

二、逆向案例之基本爬虫

补充知识点:

浏览器 --> 服务器发送请求有两种模式:

模式一:服务器从数据库取出来的数据,有可能直接把数据在服务器侧,就把数据塞到页面中,然后直接把该页面进行返回。比如:百度热搜,热搜的数据就嵌在页面中,这时候就需要把该页面爬下来,然后用正则、XPass什么的对页面进行解析获取页面源码中的数据, ---这个是少数情况

模式二:浏览器向服务器发送一个请求,服务器先给浏览器返回一个页面(只有页面布局),但是核心数据没有,这个时候浏览器就需要通过Ajax再次发送请求,单独获取页面数据,再把数据加载到页面中。所以我们正常只需要进行对Ajax进行破解就好了,不需要进行正则什么的;需要用到正则、Xpass什么是数据嵌在页面中的。---该模式属于正常的大多数模式

1.1、技能一:学习排除干扰请求

通过点击页码获取的单个Ajax接口,除了单个参数页码不一样其他都一致

1.2、技能二:根据获取的接口,构建基础爬虫代码,发送请求

问题一:content-type:请求体的数据格式

res = requests.post(url=url, json=data, headers=header)

问题二:因为请求体全部内容已经复制包含,那提示的:接口请求签名错误,肯定是在请求头中,所以补充portal-sign

复制代码
import requests

# 基础爬虫,既是模仿Ajax发送数据请求,获取和浏览器一样的返回数据
# URL 请求方式 请求头 请求参数-get 请求体-post
# 请求头
headers = {
    "user-agent":
        "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36",
        "portal-sign":"7c7cc7c720e63b573b1827244fd0cf12"
}
# 请求URL
url = "https://ggzyfw.fujian.gov.cn/FwPortalApi/Trade/TradeInfo"

# 请求体-post  点击复制--复制object
data = {
    "pageNo": 3,
    "pageSize": 20,
    "total": 2755,
    "AREACODE": "",
    "M_PROJECT_TYPE": "",
    "KIND": "GCJS",
    "GGTYPE": "1",
    "PROTYPE": "",
    "timeType": "6",
    "BeginTime": "2025-02-08 00:00:00",
    "EndTime": "2025-08-08 23:59:59",
    "createTime": "",
    "ts": 1754618383170
}

# 发送请求
# res = requests.post(url, data=data, headers=headers)  data 会默认把请求体按照urlencoded去处理   参数校验错误
res = requests.post(url, json=data, headers=headers)  # 所以,我们这里需要使用json处理
print(res.text)

#  逆向--就是破解算法,算法是什么,就是各种加密   处理响应结果的加密

1.3、技能三:快速生成爬虫代码:https://curlconverter.com/

复制代码
import requests

headers = {
    'Accept': 'application/json, text/plain, */*',
    'Accept-Language': 'zh-CN,zh;q=0.9',
    'Connection': 'keep-alive',
    'Content-Type': 'application/json;charset=UTF-8',
    'Origin': 'https://ggzyfw.fujian.gov.cn',
    'Referer': 'https://ggzyfw.fujian.gov.cn/business/list/',
    'Sec-Fetch-Dest': 'empty',
    'Sec-Fetch-Mode': 'cors',
    'Sec-Fetch-Site': 'same-origin',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36',
    'portal-sign': '30b786c2f4b4e6fa6b2c7e0da2b9bae9',
    'sec-ch-ua': '"Chromium";v="128", "Not;A=Brand";v="24", "Google Chrome";v="128"',
    'sec-ch-ua-mobile': '?0',
    'sec-ch-ua-platform': '"Windows"',
}

json_data = {
    'pageNo': 1,
    'pageSize': 20,
    'total': 2757,
    'AREACODE': '',
    'M_PROJECT_TYPE': '',
    'KIND': 'GCJS',
    'GGTYPE': '1',
    'PROTYPE': '',
    'timeType': '6',
    'BeginTime': '2025-02-08 00:00:00',
    'EndTime': '2025-08-08 23:59:59',
    'createTime': '',
    'ts': 1754622577806,
}
url = "https://ggzyfw.fujian.gov.cn/FwPortalApi/Trade/TradeInfo"
response = requests.post(url, headers=headers, json=json_data)
print(response.text)

点击接口 --> 右键:复制 --> 选择:以cURL(bash)格式复制

三、逆向案例之响应入口定位

2.1、技能一:JS逆向流程(原理)

1、发送第一次请求:当通过浏览器第一次访问服务器获取数据

2、HTML+CSS+JS:服务器就会从数据库把浏览器第一次访问需要获取的HTML和CSS还有JS一起打包发送给浏览器,

其中HTML和CSS的浏览器页面布局相关,所以爬虫可以忽略;但是在返回的数据包中还有JS,JS是一种脚本语言,来自服务器,作用就是跟页面的动态事件相关,比如:弹窗、点击页码向后端发送Ajax请求获取分页数据等。【爬虫逆向重点关注通过JS向后端发送的Ajax请求数据和响应数据】

3.1、目标Ajax请求(浏览器):当页面渲染完成以后,我们通过点击【页码】发送Ajax请求,定位我们需要爬取的接口链接,

4.1、响应的Json数据(浏览器):服务器返回点击页码获取的新数据,返回的数据是加密的

3.2、目标Ajax请求(爬虫代码):通过Python代码模仿浏览对服务器进行发送请求,获取加密的响应数据

4.2、响应的Json数据(爬虫代码):通过Python代码模拟浏览器发送Ajax请求,获取服务器返回的加密数据

以上流程到此,已经获取到了服务器返回的数据,但是返回的数据是加密的,逆向既是对返回的数据进行解密,所以我们后续只需要重点关注【对返回的数据进行解密即可】,既然浏览器可以把加密的数据正常渲染,那么必定有一块JS代码是专门用来解密返回的数据的,所以我们需要定位到该段JS代码,并且通过代码模拟解密的过程,破解返回的加密数据

2.2、解密代码定位

1、搜索--嫌疑代码

通过以上操作,如果搜索:【 decrypt 】 定位到26个匹配行;如果搜索:【 decrypt( 】 定位到2个匹配行,然后在定位到的2个匹配行上打断点----{确定了两个嫌疑犯},然后再次点击页码进行确定是那个代码块,当点击完页码以后,那个断点卡住了就证明走了定位的那个方法----【确定了那个嫌疑犯才是罪魁祸首】,这个时候就找到了JS代码中针对返回的加密数据的处理方式,

2、定位嫌疑代码

3、分析解密代码

4、如何确定这段代码就是我们想要的呢?

e = h.a.enc.Utf8.parse(r["e"]) 得知 e 就是一个固定值,32位长度的字符串:"EB444973714E4A40876CE66BE45D5930"   AES的key值

n = h.a.enc.Utf8.parse(r["i"]) 得知 i 就是一个固定值,16位长度的字符串:"B5A8904209931867"             AES的iv值

t 是需要解密的数据{服务器返回的加密数据}

备注:加密知识可以参考 爬虫&逆向--Day08--加密算法

问题一:入口定位方式都有那些

复制代码
-- 关键字搜索
   -- 方法关键字
      -- encrypt  加密
      -- decrypt  解密   该案例解密使用的定位方式
   -- key关键字(最高频)

   -- headers关键字
   -- 路径关键字
   -- 拦截器关键字

-- 请求堆栈  标版,比较稳的一种方式,但是效率低

-- hook

四、逆向案例之Python逆向响应解密

复制代码
import base64
from Crypto.Cipher import AES
import json
from Crypto.Util.Padding import unpad

import requests

headers = {
    'Accept': 'application/json, text/plain, */*',
    'Accept-Language': 'zh-CN,zh;q=0.9',
    'Connection': 'keep-alive',
    'Content-Type': 'application/json;charset=UTF-8',
    'Origin': 'https://ggzyfw.fujian.gov.cn',
    'Referer': 'https://ggzyfw.fujian.gov.cn/business/list/',
    'Sec-Fetch-Dest': 'empty',
    'Sec-Fetch-Mode': 'cors',
    'Sec-Fetch-Site': 'same-origin',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36',
    'portal-sign': '95a50c89ade7a5a73c03127e52ea5a2c',
    'sec-ch-ua': '"Chromium";v="128", "Not;A=Brand";v="24", "Google Chrome";v="128"',
    'sec-ch-ua-mobile': '?0',
    'sec-ch-ua-platform': '"Windows"',
}

json_data = {
    'pageNo': 2,
    'pageSize': 20,
    'total': 2795,
    'AREACODE': '',
    'M_PROJECT_TYPE': '',
    'KIND': 'GCJS',
    'GGTYPE': '1',
    'PROTYPE': '',
    'timeType': '6',
    'BeginTime': '2025-02-11 00:00:00',
    'EndTime': '2025-08-11 23:59:59',
    'createTime': '',
    'ts': 1754900503314,
}

response = requests.post('https://ggzyfw.fujian.gov.cn/FwPortalApi/Trade/TradeInfo', headers=headers, json=json_data)



# 这个获得的是字符串类型,所以不能操作,我们需要获取Json类型
# print(response.text)
# print(type(response.text))  # <class 'str'>

# 基于Python实现AES算法进行解密
# response.json() 获取的是字典类型
# print(type(response.json()))  # <class 'dict'>
# response.json().get("Data")  然后在get对应的key
data = response.json().get("Data")
# 先base64解码得到需要解密的数据,在进行解密   【知识点补充一】
data = base64.b64decode(data)

k = "EB444973714E4A40876CE66BE45D5930".encode()  # key可能是16位的,也可能是32位的,
iv = "B5A8904209931867".encode()  # iv一定是16位的  .encode()是一定要它的字节串
# 创建aes的对象  使用上面的一套 k 和 iv 既可以进行加密,也可以进行解密
aes_obj = AES.new(key=k, mode=AES.MODE_CBC, iv=iv)
# AES解密
data = aes_obj.decrypt(data)  # 得到的是b'xxx' 字节,  data.decode()字节转字符串直接
# print("data::::", data)  # 得到二进制字节数据
# data:::: b'{\r\n   }\r\n  ]\r\n}\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f\x0f'


# data_str = data.decode()      # 把二进制字节数据,转化为字符串
# 因为AES加密要求数据的长度必须是块大小的倍数,所以数据长度不足,需要进行填充(Padding)
# json.loads(unpad(data, AES.block_size).decode('utf-8'))
data_str = unpad(data, AES.block_size).decode('utf-8')  # 因为AES带有填充,所以需要先用unpad去除填充
# print("data_str::::", data_str)

# 把解密开的数据进行反序列化         字符串转字典
data_dict = json.loads(data_str)
# print("data_dict::::", data_dict)

# 所有的数据都在列表Table中,所以我们便利Table列表
print(data_dict.get("Table"))
for i in data_dict.get("Table"):
    # 获取每个文件的NAME名称
    print(i.get("NAME"))



"""  【知识点补充一】
Base64编码,是由64个字符组成编码集:26个大写字母A~Z,26个小写字母a~z,10个数字0~9,符号“+”与符号“/”
base64编码示例
    # 将原始数据转化为二进制/字节数据
    data = "you".encode("utf-8")
    print(data)                             # b'you'
    # 把字节转化成b64
    bs = base64.b64encode(data).decode()
    print(bs)                               # eW91

base64解码示例
    s = "eW91"
    ret = base64.b64decode(s)
    print(ret)  # 正确        b'you'
"""


"""  【知识点补充二】
二进制字节---字符串
    unpad(data, AES.block_size).decode('utf-8')
字符串---对象
    json.loads(data_str)
"""

五、逆向案例之JS逆向响应解密

背景:由于本案例解密的JS代码块比较简单,所以我们可以通过上面的第四步:逆向案例之Python逆向响应解密 进行解密操作,但是当我们遇到JS解密代码比较繁琐和复杂的时候再用Python代码进行破解就比较麻烦,所以我们就需要把对应的解密代码块直接扣出来,在浏览器外部使用node进行运行。

5.1、确定JS中的解密代码块是那部分

5.2、补充和安装第三方依赖库 npm install crypto-js

如果没有安装crypto-js 需要安装一下 npm install crypto-js

JS中使用npm Python中使用pip 区别是:npm 放到当前目录下 pip放到全部python的安装包里面去

5.3、根据不考虑代码逻辑,只考虑在不改变代码逻辑的基础上,尽可能的代码替换和平移 替换 key 和 iv

5.4、测试扣出来的JS代码是否可行,如果可行后续就方便在Python中直接调用

5.5、在Python代码中调用JS解密代码,进行解密操作

备注: 有些有些中文不兼容问题 可能导致在执行 js_code_compile.call("b", data) Python调用JS代码时报错误,需要做如下操作

复制代码
pip uninstall pyexecjs
pip install pyexecjs2
更新一下模块  

5.6、创建的JS代码块文件:05案例基于JS的响应解密.js

复制代码
/*
JS中的 require() 类似Python中的import,导入第三方标准库 crypto-js
const cryptoJs  给导入的第三方标准库起一个名字,叫:cryptoJs
如果没有安装crypto-js 需要安装一下  npm install crypto-js
JS中使用npm  Python中使用pip  区别是:npm 放到当前目录下   pip放到全部python的安装包里面去

*/
const cryptoJs = require("crypto-js")
function b(t) {
    var e = cryptoJs.enc.Utf8.parse("EB444973714E4A40876CE66BE45D5930")
        , n = cryptoJs.enc.Utf8.parse("B5A8904209931867")
        , a = cryptoJs.AES.decrypt(t, e, {
        iv: n,
        mode: cryptoJs.mode.CBC,
        padding: cryptoJs.pad.Pkcs7
    });
    return a.toString(cryptoJs.enc.Utf8)
}

/*
以上的这段代码,我们无需关注代码的业务流程,只需要直接运行缺什么环境依赖,补什么环境依赖。
经过对比和了解,enc和AES都是标准库,所以我们无需研究enc和AES,在上面直接导入JS中的标准库即可
把上方代码中的 h.a 全部更换为:
*/

// 使用服务器返回的加密数据,进行对如上的代码进行测试
// data = ""
// console.log(b(data))  // 调用修改后的加密方法,获取解密数据

5.7、创建的Python代码文件:04案例基于JS的响应解密.py

复制代码
import execjs
import requests

headers = {
    'Accept': 'application/json, text/plain, */*',
    'Accept-Language': 'zh-CN,zh;q=0.9',
    'Connection': 'keep-alive',
    'Content-Type': 'application/json;charset=UTF-8',
    'Origin': 'https://ggzyfw.fujian.gov.cn',
    'Referer': 'https://ggzyfw.fujian.gov.cn/business/list/',
    'Sec-Fetch-Dest': 'empty',
    'Sec-Fetch-Mode': 'cors',
    'Sec-Fetch-Site': 'same-origin',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36',
    'portal-sign': 'e289a313d00e3c58fc562cf2d9f257fa',
    'sec-ch-ua': '"Chromium";v="128", "Not;A=Brand";v="24", "Google Chrome";v="128"',
    'sec-ch-ua-mobile': '?0',
    'sec-ch-ua-platform': '"Windows"',
}

json_data = {
    'pageNo': 1,
    'pageSize': 20,
    'total': 0,
    'AREACODE': '',
    'M_PROJECT_TYPE': '',
    'KIND': 'GCJS',
    'GGTYPE': '1',
    'PROTYPE': '',
    'timeType': '6',
    'BeginTime': '2025-02-11 00:00:00',
    'EndTime': '2025-08-11 23:59:59',
    'createTime': '',
    'ts': 1754910932790,
}

response = requests.post('https://ggzyfw.fujian.gov.cn/FwPortalApi/Trade/TradeInfo', headers=headers, json=json_data)

# print(response.text)

# 基于JS实现AES算法进行解密

# 先打开,然后逐行读取JS代码
with open("05案例基于JS的响应解密.js", encoding="utf-8") as f:
    js_code = f.read()

# execjs.compile  编译这个js代码  创建编译器   js_code_compile 可以调用JS代码中的任意一个函数
js_code_compile = execjs.compile(js_code)
data = response.json().get("Data")
# print("data:::",data)

# 调用JS代码中的b函数,把data作为参数进行传递
res = js_code_compile.call("b", data)
print(res)


"""
pip uninstall pyexecjs
pip install pyexecjs2
更新一下模块
"""

六、逆向案例之JS逆向请求加密

6.1、逆向请求加密操作的注解

爬虫的本质就是通过代码,自动化获取大量数据,所以在之前的一些小案例中当我们仅仅修改页码相关的字段类似:pageNo=3修改为pageNo=1等就能自动获取多个页面的数据;如果嵌套到循环中,就可以自动的获取更多页面的数据;截至到第五步:逆向案例之JS逆向响应解密,我们已经可以把服务器返回的数据进行解密了,但是在发送请求时,我们按照之前的逻辑更新pageNo等页码相关的字段再次获取数据提示错误,所以很明显对应的请求也是做了加密处理,所以我们需要在爬虫代码中也模仿浏览器的加密操作,做和浏览器相同的操作,然后在发送给服务器即可。

6.2、定位本地JS代码中针对请求加密生成portal-sign的代码块,然后在爬虫中进行复现即可【MD5和Base84区别】

问题一:理论上我们定位加密,应该是搜索encrypt,但是该案例不可行

问题二:要求:每个人必须得认识md5值,base64值

复制代码
        --MD5值位数是固定的长度是32位的,
            portal-sign:首先是32位,其次构成是0-9、a-f,没有f以后的字母是典型的MD5值
        --base64位数是4的倍数,没固定的长度,数据越长位数越长
       特点:base64只包含:0-9、a-z、A-Z / +  

而且MD5是摘要算法,不是加密算法,所以我们如果想破解portal-sign就不应该搜索encrypt加密,AES、DES、RSA这些是加密算法,搜索encrypt是可以的,如果是MD5搜索encrypt正常是搜索不出来的。所以看到是MD5加密,就不应该去搜encrypt。

不相信你也可以搜索encrypt或者搜索MD5,首先是全局搜索,然后打断点,然后进行请求发送,一套流程走下来,会发现并没有走断点。所以以上的这些搜索都是不可用的,这时候我们就需要换个搜索方式:key关键字

在通过key关键字进行搜索的时候,该关键字越古怪越好,这样就方便在众多的代码中一眼找到定位到,如果key关键字不是很好找,还有个方式,就是搜索我们需要定位的比如Portal-Sign附近的比较怪异的词,然后迂回的方式在定位到我们的目标key,反正不管用什么手段目的只有一个,既是定位到我们需要找到的定位的那个key。

6.2.1、定位key关键词所在的JS代码中的位置

6.2.2、确定加密方法并进入

备注:到此其实我们就又回到了之前讲的,有两种处理方式,方式一用Python代码去模拟该加密,方式二直接扣JS代码进行环境补充平替,这里我们选择方式二。

6.2.3、扣出加密的JS代码,在外部使用node进行运行,缺什么环境补什么环境,方便后期使用Python代码进行调用

6.3.4、根据缺什么补什么的理念,使用node运行测试代码,报如下错误

问题一:拿任何的变量,断点需要在当前环境下,拿任何变量的值需要保证断点在当前函数内,所以我们想要哪一行的变量值,我们就把断点断在对应的行上

问题二:环境依赖,根据代码的依赖关系,补全环境

备注:同样的内容,MD5生成的内容是一样的

复制代码
console.log(cryptoJs.MD5("123456").toString())
//e10adc3949ba59abbe56e057f20f883e
/*
备注:
    cryptoJs.MD5("123456").toString()  调用的是toString
    s(n).toLocaleLowerCase()  调用的是toLocaleLowerCase
    因为所使用的第三方库不一样,所以在进行MD5操作的时候调用的具体方法也会出现不一致的情况,属于正常
*/

经过以上的确定和判断,我们可以直接使用我们的第三方库cryptoJs,替换方法n

由于数据data是一致的,所以数据通过MD5加密处理后的生成结果也必定是一致的,所以两边的结果应该是一致的

6.2.5、创建的JS代码块文件:05案例基于JS的响应解密.js

复制代码
//****************************************************响应解密*******************************
/*
JS中的 require() 类似Python中的import,导入第三方标准库 crypto-js
const cryptoJs  给导入的第三方标准库起一个名字,叫:cryptoJs
如果没有安装crypto-js 需要安装一下  npm install crypto-js
JS中使用npm  Python中使用pip  区别是:npm 放到当前目录下   pip放到全部python的安装包里面去

*/
const cryptoJs = require("crypto-js")

function b(t) {
    var e = cryptoJs.enc.Utf8.parse("EB444973714E4A40876CE66BE45D5930"),
        n = cryptoJs.enc.Utf8.parse("B5A8904209931867"), a = cryptoJs.AES.decrypt(t, e, {
            iv: n, mode: cryptoJs.mode.CBC, padding: cryptoJs.pad.Pkcs7
        });
    return a.toString(cryptoJs.enc.Utf8)
}


/*
以上的这段代码,我们无需关注代码的业务流程,只需要直接运行缺什么环境依赖,补什么环境依赖。
经过对比和了解,enc和AES都是标准库,所以我们无需研究enc和AES,在上面直接导入JS中的标准库即可
把上方代码中的 h.a 全部更换为:

*/
// 使用服务器返回的加密数据,进行对如上的代码进行测试
// data = ""
// console.log(b(data))  // 调用修改后的加密方法,获取解密数据

//****************************************************请求加密*******************************
function l(t, e) {
            return t.toString().toUpperCase() > e.toString().toUpperCase() ? 1 : t.toString().toUpperCase() == e.toString().toUpperCase() ? 0 : -1
        }
function u(t) {
    for (var e = Object.keys(t).sort(l), n = "", a = 0; a < e.length; a++)
        if (void 0 !== t[e[a]])
            if (t[e[a]] && t[e[a]] instanceof Object || t[e[a]] instanceof Array) {
                var i = JSON.stringify(t[e[a]]);
                n += e[a] + i
            } else
                n += e[a] + t[e[a]];
    return n
}


function d(t) {
    for (var e in t) "" !== t[e] && void 0 !== t[e] || delete t[e];
    var n = "B3978D054A72A7002063637CCDF6B2E5" + u(t);
    return cryptoJs.MD5(n).toString()
}


// 测试代码
// data = {
//     "ts": 1754982379972,
//     "pageNo": 2,
//     "pageSize": 20,
//     "total": 2800,
//     "AREACODE": "",
//     "M_PROJECT_TYPE": "",
//     "KIND": "GCJS",
//     "GGTYPE": "1",
//     "PROTYPE": "",
//     "timeType": "6",
//     "BeginTime": "2025-02-12 00:00:00",
//     "EndTime": "2025-08-12 23:59:59",
//     "createTime": ""
// }
//
// console.log(d(data))

//console.log(cryptoJs.MD5("123456").toString())
//e10adc3949ba59abbe56e057f20f883e
/*
备注:
    cryptoJs.MD5("123456").toString()  调用的是toString
    s(n).toLocaleLowerCase()  调用的是toLocaleLowerCase
    因为所使用的第三方库不一样,所以在进行MD5操作的时候调用的具体方法也会出现不一致的情况,属于正常
*/

6.2.6、创建的Python代码文件:06案例基于JS的响应解密.py

复制代码
import execjs
import requests
import time
headers = {
    'Accept': 'application/json, text/plain, */*',
    'Accept-Language': 'zh-CN,zh;q=0.9',
    'Connection': 'keep-alive',
    'Content-Type': 'application/json;charset=UTF-8',
    'Origin': 'https://ggzyfw.fujian.gov.cn',
    'Referer': 'https://ggzyfw.fujian.gov.cn/business/list/',
    'Sec-Fetch-Dest': 'empty',
    'Sec-Fetch-Mode': 'cors',
    'Sec-Fetch-Site': 'same-origin',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36',
    # 'portal-sign': 'e289a313d00e3c58fc562cf2d9f257fa',   这个就不在需要了
    'sec-ch-ua': '"Chromium";v="128", "Not;A=Brand";v="24", "Google Chrome";v="128"',
    'sec-ch-ua-mobile': '?0',
    'sec-ch-ua-platform': '"Windows"',
}

# 获取当前时间戳
# time.time()  10位的浮点型,所以需要乘以1000
# int(time.time()*1000)  在用int转换把小数点后面的删掉,等到13位的整型
# str(int(time.time()*1000))  如何需要可以再次转换成字符串,【本案例不需要,本案例是数字所以转到int即可】
now = int(time.time()*1000)

json_data = {
    'pageNo': 2,
    'pageSize': 20,
    'total': 0,
    'AREACODE': '',
    'M_PROJECT_TYPE': '',
    'KIND': 'GCJS',
    'GGTYPE': '1',
    'PROTYPE': '',
    'timeType': '6',
    'BeginTime': '2025-02-11 00:00:00',
    'EndTime': '2025-08-11 23:59:59',
    'createTime': '',
    'ts': now,
}

# (1)请求加密:基于json_data生成sign值
# 先打开,然后逐行读取JS代码
with open("05案例基于JS的响应解密.js", encoding="utf-8") as f:
    js_code = f.read()

# 获取JS代码的编译器
js_compile = execjs.compile(js_code)

# 通过JS代码编译器,调用d方法
sign = js_compile.call("d", json_data)
# print("sign:::", sign)

# 把生成的sign写入到请求头中
headers["portal-sign"] = sign

response = requests.post('https://ggzyfw.fujian.gov.cn/FwPortalApi/Trade/TradeInfo', headers=headers, json=json_data)

print(response.text)

七、综合以上,最终代码如下

7.1、Python文件:07JS逆向最终版.py

复制代码
07JS逆向最终版.py
复制代码
import execjs
import requests
import time

# 把冗余代码提出来
# 先打开,然后逐行读取JS代码
with open("05案例基于JS的响应解密.js", encoding="utf-8") as f:
    js_code = f.read()
# 获取JS代码的编译器
js_code_compile = execjs.compile(js_code)

headers = {
    'Accept': 'application/json, text/plain, */*',
    'Accept-Language': 'zh-CN,zh;q=0.9',
    'Connection': 'keep-alive',
    'Content-Type': 'application/json;charset=UTF-8',
    'Origin': 'https://ggzyfw.fujian.gov.cn',
    'Referer': 'https://ggzyfw.fujian.gov.cn/business/list/',
    'Sec-Fetch-Dest': 'empty',
    'Sec-Fetch-Mode': 'cors',
    'Sec-Fetch-Site': 'same-origin',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36',
    # 'portal-sign': 'e289a313d00e3c58fc562cf2d9f257fa',   这个就不在需要了
    'sec-ch-ua': '"Chromium";v="128", "Not;A=Brand";v="24", "Google Chrome";v="128"',
    'sec-ch-ua-mobile': '?0',
    'sec-ch-ua-platform': '"Windows"',
}

def get_one_page(page):
    # 获取当前时间戳
    # time.time()  10位的浮点型,所以需要乘以1000
    # int(time.time()*1000)  在用int转换把小数点后面的删掉,等到13位的整型
    # str(int(time.time()*1000))  如何需要可以再次转换成字符串,【本案例不需要,本案例是数字所以转到int即可】
    now = int(time.time() * 1000)
    json_data = {
        'pageNo': page,
        'pageSize': 20,
        'total': 0,
        'AREACODE': '',
        'M_PROJECT_TYPE': '',
        'KIND': 'GCJS',
        'GGTYPE': '1',
        'PROTYPE': '',
        'timeType': '6',
        'BeginTime': '2025-02-11 00:00:00',
        'EndTime': '2025-08-11 23:59:59',
        'createTime': '',
        'ts': now,
    }

    # (1)请求加密:基于json_data生成sign值
    """  冗余代码
    # 先打开,然后逐行读取JS代码
    with open("05案例基于JS的响应解密.js", encoding="utf-8") as f:
        js_code = f.read()

    # 获取JS代码的编译器
    js_compile = execjs.compile(js_code)
    """

    # 通过JS代码编译器,调用d方法
    sign = js_code_compile.call("d", json_data)
    # print("sign:::", sign)

    # 把生成的sign写入到请求头中
    headers["portal-sign"] = sign

    response = requests.post('https://ggzyfw.fujian.gov.cn/FwPortalApi/Trade/TradeInfo', headers=headers,
                             json=json_data)
    # print(response.text)

    # (2)响应解密:基于JS实现AES算法进行解密
    """     冗余代码
    # 先打开,然后逐行读取JS代码
    with open("05案例基于JS的响应解密.js", encoding="utf-8") as f:
        js_code = f.read()

    # 获取JS代码的编译器
    js_code_compile = execjs.compile(js_code)
    """

    data = response.json().get("Data")
    # 调用JS代码中的b函数,把data作为参数进行传递
    res = js_code_compile.call("b", data)
    print("res:::", res)


def main():
    for i in range(1, 6):
        time.sleep(2)
        get_one_page(i)


main()

7.2、JS文件:05案例基于JS的响应解密.js

复制代码
05案例基于JS的响应解密.js
//****************************************************响应解密*******************************
/*
JS中的 require() 类似Python中的import,导入第三方标准库 crypto-js
const cryptoJs  给导入的第三方标准库起一个名字,叫:cryptoJs
如果没有安装crypto-js 需要安装一下  npm install crypto-js
JS中使用npm  Python中使用pip  区别是:npm 放到当前目录下   pip放到全部python的安装包里面去

*/
const cryptoJs = require("crypto-js")

function b(t) {
    var e = cryptoJs.enc.Utf8.parse("EB444973714E4A40876CE66BE45D5930"),
        n = cryptoJs.enc.Utf8.parse("B5A8904209931867"), a = cryptoJs.AES.decrypt(t, e, {
            iv: n, mode: cryptoJs.mode.CBC, padding: cryptoJs.pad.Pkcs7
        });
    return a.toString(cryptoJs.enc.Utf8)
}


/*
以上的这段代码,我们无需关注代码的业务流程,只需要直接运行缺什么环境依赖,补什么环境依赖。
经过对比和了解,enc和AES都是标准库,所以我们无需研究enc和AES,在上面直接导入JS中的标准库即可
把上方代码中的 h.a 全部更换为:

*/
// 使用服务器返回的加密数据,进行对如上的代码进行测试
// data = ""
// console.log(b(data))  // 调用修改后的加密方法,获取解密数据

//****************************************************请求加密*******************************
function l(t, e) {
            return t.toString().toUpperCase() > e.toString().toUpperCase() ? 1 : t.toString().toUpperCase() == e.toString().toUpperCase() ? 0 : -1
        }
function u(t) {
    for (var e = Object.keys(t).sort(l), n = "", a = 0; a < e.length; a++)
        if (void 0 !== t[e[a]])
            if (t[e[a]] && t[e[a]] instanceof Object || t[e[a]] instanceof Array) {
                var i = JSON.stringify(t[e[a]]);
                n += e[a] + i
            } else
                n += e[a] + t[e[a]];
    return n
}


function d(t) {
    for (var e in t) "" !== t[e] && void 0 !== t[e] || delete t[e];
    var n = "B3978D054A72A7002063637CCDF6B2E5" + u(t);
    return cryptoJs.MD5(n).toString()
}


// 测试代码
// data = {
//     "ts": 1754982379972,
//     "pageNo": 2,
//     "pageSize": 20,
//     "total": 2800,
//     "AREACODE": "",
//     "M_PROJECT_TYPE": "",
//     "KIND": "GCJS",
//     "GGTYPE": "1",
//     "PROTYPE": "",
//     "timeType": "6",
//     "BeginTime": "2025-02-12 00:00:00",
//     "EndTime": "2025-08-12 23:59:59",
//     "createTime": ""
// }
//
// console.log(d(data))

//console.log(cryptoJs.MD5("123456").toString())
//e10adc3949ba59abbe56e057f20f883e
/*
备注:
    cryptoJs.MD5("123456").toString()  调用的是toString
    s(n).toLocaleLowerCase()  调用的是toLocaleLowerCase
    因为所使用的第三方库不一样,所以在进行MD5操作的时候调用的具体方法也会出现不一致的情况,属于正常
*/

八、今日作业

复制代码
破解网站:https://www.swhysc.com/swhysc/news/company