7.29爬虫修复

1、加密算法sha、与时间加密。f12前端页面,所有文件中查询到指定字段。

2、加锁维护token或jwt之类的凭证,双if嵌套判断

3、熟悉公司整体项目框架,前端、nginx服务器,后端服务器

4、scrapy的爬虫过滤,注意重复url在srcapy.Request方法里面会过滤掉,重复字段的请求要允许过滤。

5、pymysql的异步修改、插入会产生链接问题,推荐使用DButl的连接池进行配置pymysql。

相关推荐
无敌最俊朗@17 分钟前
**HTTP/HTTPS基础** - URL结构(协议、域名、端口、路径、参数、锚点) - 请求方法(GET、POST) - 请求头/响应头 - 状态码含义
爬虫·python·网络协议·http·https
漫路在线12 小时前
JS逆向-某易云音乐下载器
开发语言·javascript·爬虫·python
小生凡一15 小时前
搜索引擎工作原理|倒排索引|query改写|CTR点击率预估|爬虫
爬虫·搜索引擎
CodeJourney.16 小时前
基于MATLAB的生物量数据拟合模型研究
人工智能·爬虫·算法·matlab·信息可视化
一只专注api接口开发的技术猿16 小时前
企业级电商数据对接:1688 商品详情 API 接口开发与优化实践
大数据·前端·爬虫
江禾藜18 小时前
Python爬虫之路(14)--playwright浏览器自动化
爬虫·python·自动化
北漂老男孩20 小时前
ChromeDriver进程泄漏问题分析与最佳实践解决方案
开发语言·爬虫
一个天蝎座 白勺 程序猿1 天前
Python爬虫(29)Python爬虫高阶:动态页面处理与云原生部署全链路实践(Selenium、Scrapy、K8s)
redis·爬虫·python·selenium·scrapy·云原生·k8s
weixin-WNXZ02181 天前
闲上淘 自动上货工具运行原理解析
爬虫·python·自动化·软件工程·软件需求
q567315231 天前
图片爬虫通过模板及使用说明
开发语言·爬虫·tcp/ip·golang