抖音中文点选验证码识别方案

最近研究了一下抖音中文点选验证码的识别,居然正确率高达98%。

首先我们来看一下效果

一、识别方法

1、数据集准备

我们需要借助爬虫去下载大量的验证码图片。这些有两种图片,一种是小图,包含需要点选的中文和顺序,还有一种是大图,需要进行点选的地方,如下图:

2、标注中文位置

使用labelimg标注中文位置,之后会进行中文位置识别训练,如下图

3、标记每一个中文小图

4、训练识别模型

5、测试验证

我们将训练好的模型用100张图片来进行测试,虽然识别出来角度有所偏差,但是这个误差范围都能够使验证通过,所以正确率接近100%。因为100张测试图片比较少,所以保守估计正确率应该在99%左右。

如果再想提升正确率,可以再增加训练的数据量,就需要再投入大量人力,这个投入与提升产出比需要自己权衡。

二、免费使用地址

我将训练好的模型放在了网上,可以供大家免费学习使用:得塔云

相关推荐
兔子小灰灰1 分钟前
论文笔记:π0.5 (PI 0.5)KI改进版
人工智能·深度学习
PKNLP3 分钟前
Transformer模型
人工智能·深度学习·transformer
渡我白衣4 分钟前
深度学习进阶(一)——从 LeNet 到 Transformer:卷积的荣光与注意力的崛起
人工智能·深度学习·transformer
机器之心6 分钟前
蚂蚁Ring-1T正式登场,万亿参数思考模型,数学能力对标IMO银牌
人工智能·openai
Small___ming10 分钟前
【Python基础】Python路径操作全解析:os.path、glob与pathlib从入门到精通
开发语言·python
用户51914958484511 分钟前
深入探索Next.js中的SSRF漏洞挖掘
人工智能·aigc
这里有鱼汤16 分钟前
3步用Python识别MACD背驰,避免80%追涨杀跌陷阱,建议收藏
后端·python
一车小面包17 分钟前
BERT 中文外卖评价情感分析项目
人工智能·深度学习·bert
数在表哥32 分钟前
从数据沼泽到智能决策:数据驱动与AI融合的中台建设方法论与技术实践指南(一)
大数据·人工智能
诸葛箫声33 分钟前
手写数据集的深度学习
人工智能·深度学习·机器学习