抖音中文点选验证码识别方案

最近研究了一下抖音中文点选验证码的识别,居然正确率高达98%。

首先我们来看一下效果

一、识别方法

1、数据集准备

我们需要借助爬虫去下载大量的验证码图片。这些有两种图片,一种是小图,包含需要点选的中文和顺序,还有一种是大图,需要进行点选的地方,如下图:

2、标注中文位置

使用labelimg标注中文位置,之后会进行中文位置识别训练,如下图

3、标记每一个中文小图

4、训练识别模型

5、测试验证

我们将训练好的模型用100张图片来进行测试,虽然识别出来角度有所偏差,但是这个误差范围都能够使验证通过,所以正确率接近100%。因为100张测试图片比较少,所以保守估计正确率应该在99%左右。

如果再想提升正确率,可以再增加训练的数据量,就需要再投入大量人力,这个投入与提升产出比需要自己权衡。

二、免费使用地址

我将训练好的模型放在了网上,可以供大家免费学习使用:得塔云

相关推荐
AIGC方案27 分钟前
deepseek热度已过?
人工智能·大模型
88号技师27 分钟前
模糊斜率熵Fuzzy Slope entropy+状态分类识别!2024年11月新作登上IEEE Trans顶刊
人工智能·机器学习·分类·数据挖掘·信号处理·故障诊断·信息熵
死磕代码程序媛1 小时前
谷歌25年春季新课:15小时速成机器学习
人工智能·机器学习
凌叁儿1 小时前
python保留关键字详解
开发语言·python
有Li1 小时前
弥合多层次差距:用于超声心动图中基于文本引导的标签高效分割的双向循环框架|文献速递-深度学习医疗AI最新文献
人工智能
橙色小博1 小时前
Transformer模型解析与实例:搭建一个自己的预测语言模型
人工智能·深度学习·神经网络·机器学习·transformer
意.远2 小时前
PyTorch实现二维卷积与边缘检测:从原理到实战
人工智能·pytorch·python·深度学习·神经网络·计算机视觉
勤劳的进取家2 小时前
贪心算法之最小生成树问题
数据结构·python·算法·贪心算法·排序算法·动态规划
电报号dapp1192 小时前
2025年智能合约玩法创新白皮书:九大核心模块与收益模型重构Web3经济范式
人工智能·重构·web3·去中心化·区块链·智能合约
兮兮能吃能睡2 小时前
Python中的eval()函数详解
开发语言·python