7.29爬虫修复

1、加密算法sha、与时间加密。f12前端页面,所有文件中查询到指定字段。

2、加锁维护token或jwt之类的凭证,双if嵌套判断

3、熟悉公司整体项目框架,前端、nginx服务器,后端服务器

4、scrapy的爬虫过滤,注意重复url在srcapy.Request方法里面会过滤掉,重复字段的请求要允许过滤。

5、pymysql的异步修改、插入会产生链接问题,推荐使用DButl的连接池进行配置pymysql。

相关推荐
爬虫程序猿17 小时前
利用 Java 爬虫按关键字搜索 1688 商品详情 API 返回值说明实战指南
java·开发语言·爬虫
mjy_1111 天前
项目设计文档——爬虫项目(爬取天气预报)
爬虫
爱隐身的官人1 天前
爬虫基础学习-爬取网页项目(二)
前端·爬虫·python·学习
Java开发-楠木1 天前
【猿人学】web第一届 第13题 入门级 cookie
爬虫·python
Amazon数据采集2 天前
[5 万字]手把手教你写一个能打的Amazon评论爬虫,搞定反爬和登录限制!(2025版)
爬虫·python
爱隐身的官人2 天前
爬虫基础学习-链接协议分析,熟悉相关函数
爬虫·学习
binbinaijishu882 天前
Python爬虫入门指南:从零开始的网络数据获取之旅
开发语言·爬虫·python·其他
眰恦ゞLYF2 天前
TCP与HTTP协议以及爬虫
爬虫·网络协议·tcp协议·http协议
LCS-3123 天前
Python爬虫实战: 爬虫常用到的技术及方案详解
开发语言·爬虫·python
电商数据girl3 天前
Python 爬虫获得淘宝商品详情 数据【淘宝商品API】
大数据·开发语言·人工智能·爬虫·python·json·php