Python爬虫图片验证码和滑块验证码识别总结

前言

当我们使用selenium进行浏览器模拟的时候,已经可以解决大多数数据加密问题了,我们直接模拟浏览器行为采集数据了,但是图片验证码和滑块验证码识别对于我们浏览器模拟来说是无法绕开的反爬问题。

解决图片验证码和滑块验证码的思路

常见的使用OpenCV进行图像识别,计算出滑块的移动距离,使用selenium进行对滑块拖动

这种方法虽然是一个方案。但是OpenCV学习难度大,即使学习成功使用不熟练也只能解决一些简单的图片识别。稍微复杂点的就需要耗费大量时间进行尝试,解决验证码的代价太大,得不偿失。

可以使用第三方专业的工具对OpenCV这个功能进行代替,如使用第三方云码平台,直接调用它的API对滑块图片进行传入就会直接返回滑块移动距离,直接使用selenium拖动滑块。方便快捷,功能强大稳定。

对于selenium拖动滑块到指定位置还是不能成功的原因记录

首先,先看一下你的selenium浏览器尽量多的屏蔽自动化行为,有可能是被爬取的网址识别出你是机器,所以失效

其次,就是在移动滑块的时候,要有真人的感觉,比如:先快后慢,有小幅度的上下抖动类似的行为调整

相关推荐
code tsunami2 分钟前
DrissionPage 与 CapSolver:打造无痕、高效的自动化爬虫利器
运维·爬虫·自动化
龙腾AI白云5 分钟前
深度学习—卷积神经网络(3)
人工智能·python
qq_124987075310 分钟前
基于spark的西南天气数据的分析与应用(源码+论文+部署+安装)
大数据·分布式·爬虫·python·spark·毕业设计·数据可视化
STLearner14 分钟前
2025时空数据研究工作总结
大数据·人工智能·python·深度学习·学习·机器学习·智慧城市
2401_8414956416 分钟前
自然语言处理实战——基于BP神经网络的命名实体识别
人工智能·python·神经网络·算法·机器学习·自然语言处理·命名实体识别
七夜zippoe16 分钟前
Python元类编程-动态创建类的艺术
python·元类·高级编程·prepare·mro
明如正午20 分钟前
Kvaser使用Python收发报文示例
python·kvaser
q_302381955620 分钟前
宇树机器人又刷第一!具身智能靠强化学习解锁直立行走与快速奔跑
人工智能·python·单片机·机器人·ai编程
vvoennvv25 分钟前
【Python TensorFlow】 TCN-BiGRU时间序列卷积双向门控循环神经网络时序预测算法(附代码)
python·神经网络·机器学习·gru·tensorflow·tcn
代码方舟30 分钟前
Java Spring Boot 实战:构建天远高并发个人消费能力评估系统
java·大数据·spring boot·python