Python爬虫图片验证码和滑块验证码识别总结

前言

当我们使用selenium进行浏览器模拟的时候,已经可以解决大多数数据加密问题了,我们直接模拟浏览器行为采集数据了,但是图片验证码和滑块验证码识别对于我们浏览器模拟来说是无法绕开的反爬问题。

解决图片验证码和滑块验证码的思路

常见的使用OpenCV进行图像识别,计算出滑块的移动距离,使用selenium进行对滑块拖动

这种方法虽然是一个方案。但是OpenCV学习难度大,即使学习成功使用不熟练也只能解决一些简单的图片识别。稍微复杂点的就需要耗费大量时间进行尝试,解决验证码的代价太大,得不偿失。

可以使用第三方专业的工具对OpenCV这个功能进行代替,如使用第三方云码平台,直接调用它的API对滑块图片进行传入就会直接返回滑块移动距离,直接使用selenium拖动滑块。方便快捷,功能强大稳定。

对于selenium拖动滑块到指定位置还是不能成功的原因记录

首先,先看一下你的selenium浏览器尽量多的屏蔽自动化行为,有可能是被爬取的网址识别出你是机器,所以失效

其次,就是在移动滑块的时候,要有真人的感觉,比如:先快后慢,有小幅度的上下抖动类似的行为调整

相关推荐
兵慌码乱17 小时前
面向桌面端的资产管理系统分层架构设计与核心模块实现
python·系统架构·sqlite·pyqt5·数据库设计·桌面应用开发·mvc架构
hboot19 小时前
AI工程师第三课 - 机器学习基础
python·scikit-learn·kaggle
顾林海1 天前
Agent入门阶段-编程基础-Python:流程控制
python·agent·ai编程
呱呱复呱呱1 天前
Django CBV 源码解读:一个请求是怎么找到你的 get() 方法的
python·django
Caco_D1 天前
一行代码抓遍全网 20 个热榜!Aneiang.Pa 4.0 发布 — 极简 .NET 爬虫库
爬虫·.net
曲幽1 天前
刚部署的 LibreTranslate 频频翻车?我掏出了 20 年前的 StarDict 词典,用 FastAPI 搭了个本地词典翻译 API
python·fastapi·web·translate·goldendict·libretranslate·stardict·pystardict
荣码1 天前
用Streamlit给AI应用套个界面,10行代码出Web页面
java·python
兵慌码乱2 天前
基于Python+PyQt5+SQLite的药房管理系统实现:事务一致性与界面解耦全流程解析
python·sqlite·信号与槽·pyqt5·数据库设计·桌面应用开发·事务处理
金銀銅鐵2 天前
[Python] 体验用欧几里得算法计算最大公约数的过程
python·数学
FreakStudio2 天前
W55MH32L-EVB 上手测评:硬件 TCP/IP 加持的以太网单片机,MicroPython 零门槛开发
python·单片机·嵌入式·大学生·面向对象·并行计算·电子diy·电子计算机