某RED书旋转验证码标注工具

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路

本文的验证码网址如下,使用base64解码获得

最近,某书的旋转验证码又更新了,在我之前的文章有讲过利用梯度幅度计算图像边缘变化,然后计算出最合适的角度,如果使用我的代码之后那么这种方法对于小红书显然失效了,具体原因我们来分析一下,先看一下缺口图和背景图。此文仅介绍工具的使用,在后续的文章中将会介绍以各种方式实现验证码的识别。


其实我之前的方法并非完全失效,在测试的时候可以发现,对于古风图不适用了,其余图形还是正常,归根原因在于古风的缺口图,不仅处理了亮度和对比度的变化,本身还存在比较细致的线条轮廓,而之前的方法,通常适用于大幅度的像素变化,对于这种细致的变化不敏感,那么针对这种验证码当然也是看家本领,直接图像增强啥的全怼上去,看有没有效就完事了,或者采用训练的方法,当然,在此之前,还是要先标注一些数据集,为此,我使用python的pyqt5开发了一款标注工具,这款工具如果需要直接找我免费获取就行,当然,针对你的数据集可能还要改动一些代码,毕竟我本人开发,软件不会做的非常细致,工具界面如下

实现了几个简单的小功能,加载数据集目录,切换下一张,然后拖动角度进行模拟还原

当滑动完成之后,会以当前的角度在本地生成一张正确的图片,经过批量标注后,就能得到所有图片正确的0度角,如下。

代码也很简单,就是简单的图像旋转处理和一些控件的处理,部分代码如下:

相关推荐
喵手1 小时前
Python爬虫实战:增量爬虫实战 - 利用 HTTP 缓存机制实现“极致减负”(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·增量爬虫·http缓存机制·极致减负
喵手9 小时前
Python爬虫实战:舆情语料项目 - 从新闻抓取到文本挖掘的完整实战(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·舆论语料项目·新闻抓取到文本挖掘·爬虫实战采集舆论语料
喵手11 小时前
Python爬虫实战:数据质量检测与治理 - 构建健壮的爬虫数据管道(附CSV导出 + SQLite持久化存储)!
爬虫·python·sqlite·爬虫实战·零基础python爬虫教学·数据质量检测与治理·爬虫数据管道
喵手1 天前
Python爬虫实战:电商问答语料构建完整实战 - 从爬取到检索语料的工程化实现(附CSV导出 + SQLite持久化存储)!
爬虫·python·sqlite·爬虫实战·零基础python爬虫教学·电商问答语料构建·爬取到检索语料
yq1982043011562 天前
基于Python爬虫原理的Pinterest视频资源获取技术解析与工具实践
爬虫·python·django·音视频
喵手2 天前
Python爬虫实战:自动化质量护航 - 构建爬虫数据的“熔断与巡检”规则引擎实战!
爬虫·python·自动化·爬虫实战·零基础python爬虫教学·自动化质量护航·数据熔断
嚯嚯歪2 天前
攻克腾讯 TCaptcha 滑块验证码:纯 HTTP 协议逆向实战
爬虫·python·逆向·验证码识别
喵手2 天前
Python爬虫实战:构建一个高健壮性的图书数据采集器!
爬虫·python·爬虫实战·零基础python爬虫教学·构建图书数据·采集图书数据·图书数据采集
喵手2 天前
Python爬虫实战:监控型爬虫实战 - 从结构检测到智能告警的完整方案(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·csv导出·监控型爬虫实战·从结构哦检测到智能告警
深蓝电商API2 天前
爬虫中 Cookie 池维护与自动刷新
爬虫·python