7.29爬虫修复

1、加密算法sha、与时间加密。f12前端页面,所有文件中查询到指定字段。

2、加锁维护token或jwt之类的凭证,双if嵌套判断

3、熟悉公司整体项目框架,前端、nginx服务器,后端服务器

4、scrapy的爬虫过滤,注意重复url在srcapy.Request方法里面会过滤掉,重复字段的请求要允许过滤。

5、pymysql的异步修改、插入会产生链接问题,推荐使用DButl的连接池进行配置pymysql。

相关推荐
dme.2 分钟前
Javascript之DOM操作
开发语言·javascript·爬虫·python·ecmascript
K哥爬虫2 小时前
【APP逆向百例】某品会 app 逆向分析
爬虫
巴里巴气5 小时前
selenium基础知识 和 模拟登录selenium版本
爬虫·python·selenium·爬虫模拟登录
凛铄linshuo1 天前
爬虫简单实操2——以贴吧为例爬取“某吧”前10页的网页代码
爬虫·python·学习
weixin_416639971 天前
爬虫工程师Chrome开发者工具简单介绍
前端·chrome·爬虫
科技苑2 天前
简单 Python 爬虫程序设计
爬虫
q567315232 天前
R语言初学者爬虫简单模板
开发语言·爬虫·r语言·iphone
泡泡以安3 天前
安卓高版本HTTPS抓包:终极解决方案
爬虫·https·安卓逆向·安卓抓包
q567315233 天前
Java Selenium反爬虫技术方案
java·爬虫·selenium
巴里巴气3 天前
Python爬虫用Clash软件设置代理IP
爬虫·python·tcp/ip