抖音中文点选验证码识别方案

最近研究了一下抖音中文点选验证码的识别,居然正确率高达98%。

首先我们来看一下效果

一、识别方法

1、数据集准备

我们需要借助爬虫去下载大量的验证码图片。这些有两种图片,一种是小图,包含需要点选的中文和顺序,还有一种是大图,需要进行点选的地方,如下图:

2、标注中文位置

使用labelimg标注中文位置,之后会进行中文位置识别训练,如下图

3、标记每一个中文小图

4、训练识别模型

5、测试验证

我们将训练好的模型用100张图片来进行测试,虽然识别出来角度有所偏差,但是这个误差范围都能够使验证通过,所以正确率接近100%。因为100张测试图片比较少,所以保守估计正确率应该在99%左右。

如果再想提升正确率,可以再增加训练的数据量,就需要再投入大量人力,这个投入与提升产出比需要自己权衡。

二、免费使用地址

我将训练好的模型放在了网上,可以供大家免费学习使用:得塔云

相关推荐
CareyWYR27 分钟前
每周AI论文速递(251215-251219)
人工智能
徐先生 @_@|||40 分钟前
(Wheel 格式) Python 的标准分发格式的生成规则规范
开发语言·python
weixin_409383121 小时前
在kaggle训练Qwen/Qwen2.5-1.5B-Instruct 通过中二时期qq空间记录作为训练数据 训练出中二的模型为目标 第一次训练 好像太二了
人工智能·深度学习·机器学习·qwen
长桥夜波1 小时前
【第二十四周】文献阅读-第一人称下的手势识别(1)
机器学习
JoannaJuanCV1 小时前
自动驾驶—CARLA仿真(22)manual_control_steeringwheel demo
人工智能·自动驾驶·pygame·carla
Mqh1807621 小时前
day45 简单CNN
python
却相迎1 小时前
2004-Image thresholding using Tsallis entropy
图像处理·阈值分割
余俊晖1 小时前
使用Agent做本体匹配的架构设计
人工智能·语言模型·自然语言处理
图像生成小菜鸟1 小时前
Score Based diffusion model 数学推导
算法·机器学习·概率论
科士威传动1 小时前
方形滚珠导轨如何保障高速定位精度?
人工智能·科技·机器人·自动化·制造