7.29爬虫修复

1、加密算法sha、与时间加密。f12前端页面,所有文件中查询到指定字段。

2、加锁维护token或jwt之类的凭证,双if嵌套判断

3、熟悉公司整体项目框架,前端、nginx服务器,后端服务器

4、scrapy的爬虫过滤,注意重复url在srcapy.Request方法里面会过滤掉,重复字段的请求要允许过滤。

5、pymysql的异步修改、插入会产生链接问题,推荐使用DButl的连接池进行配置pymysql。

相关推荐
kunge1v55 小时前
学习爬虫第四天:多任务爬虫
爬虫·python·学习·beautifulsoup
你也渴望鸡哥的力量么16 小时前
爬虫学习笔记
笔记·爬虫·学习
深蓝电商API1 天前
常见反爬虫策略与破解方案汇总
爬虫
(时光煮雨)1 天前
【Python进阶】Python爬虫-Selenium
爬虫·python·selenium
嫂子的姐夫1 天前
10-七麦js扣代码
前端·javascript·爬虫·python·node.js·网络爬虫
深蓝电商API2 天前
将爬虫部署到服务器:Scrapy+Scrapyd 实现定时任务与监控
服务器·爬虫·scrapy
nightunderblackcat2 天前
四大名著智能可视化推演平台
前端·网络·爬虫·python·状态模式
数据牧羊人的成长笔记2 天前
python爬虫scrapy框架使用
爬虫·python·scrapy
Fairy_sevenseven2 天前
[1]python爬虫入门,爬取豆瓣电影top250实践
开发语言·爬虫·python
white-persist2 天前
MCP协议深度解析:AI时代的通用连接器
网络·人工智能·windows·爬虫·python·自动化