7.29爬虫修复

T_Y99432024-07-30 14:08

1、加密算法sha、与时间加密。f12前端页面，所有文件中查询到指定字段。

2、加锁维护token或jwt之类的凭证，双if嵌套判断

3、熟悉公司整体项目框架，前端、nginx服务器，后端服务器

4、scrapy的爬虫过滤，注意重复url在srcapy.Request方法里面会过滤掉，重复字段的请求要允许过滤。

5、pymysql的异步修改、插入会产生链接问题，推荐使用DButl的连接池进行配置pymysql。

上一篇：idea常用免费插件（持续更新欢迎补充）

下一篇：Qt,获取其他.exe文件的标准输出流的信息（printf/print的输出信息）

热门推荐

01BongoCat - 跨平台键盘猫动画工具 02两千字总结：Codex 国内如何安装和使用的教程，以及如何设置中文回答 03GitHub 镜像站点 04UV安装并设置国内源 05智能库存管理的需求预测模型：从业务痛点到落地代码的完整实践 0646个Nano-banana 精选提示词，持续更新中 07Cursor Plan Mode：AI 终于知道先想后做了 08Linux下V2Ray安装配置指南 09GitLab 零基础入门指南：从安装到项目管理全流程 10一文了解国产算子编程语言 TileLang，TileLang 对国产开源生态的影响与启示