执行公开网数据采集-技术人员撤退

首先逼逼,此贴仅为秀肌肉,技术人员想学习的话可以绕道了

打开控制台,看cookie,ST,某数

第一个请求412,看VM

然后就是替换js,hook,之类的,扣代码流程,此处省略一万字,没啥说的

还有就是个小小验证码,生成个32为uid,直接请求接口,拿到图片,直接dddd识别就行,成功率挺高

python 复制代码
def distinguish_yzm(img_data):
    ocr = ddddocr.DdddOcr(show_ad=False)
    res = ocr.classification(img_data)
    return res

带上验证码识别结果和uuid请求查询接口即可

1.容易出现400,大概率是ip不行,封ip比较严重

2.cookie可以复用

3.本文目的,可以有偿提供查询接口服务或者代码服务

扣扣:MTE2MjE5NzI3OA==

需要Base64 在线编码解码 | Base64 加密解密 - Base64.us

相关推荐
web135085886352 小时前
Python大数据可视化:基于python的电影天堂数据可视化_django+hive
python·信息可视化·django
东方芷兰2 小时前
伯克利 CS61A 课堂笔记 11 —— Mutability
笔记·python
不会Hello World的小苗4 小时前
Java——列表(List)
java·python·list
m0_748235956 小时前
Python大数据可视化:基于Python的王者荣耀战队的数据分析系统设计与实现_flask+hadoop+spider
hadoop·python·flask
Dyan_csdn7 小时前
【Python项目】基于Python的Web漏洞挖掘系统
网络·python·安全·web安全
Minner-Scrapy7 小时前
DApp 开发入门指南
开发语言·python·web app
&小刘要学习&7 小时前
anaconda不显示jupyter了?
python·jupyter
jerry-897 小时前
jupyterhub_config配置文件内容
python
奔跑吧邓邓子7 小时前
【Python爬虫(36)】深挖多进程爬虫性能优化:从通信到负载均衡
开发语言·爬虫·python·性能优化·负载均衡·多进程
学长学姐我该怎么办8 小时前
年前集训总结python
python