科大讯飞分类算法挑战赛2023的一些经验总结

引言:

ResNet是he kaiming大佬的早年神作,当年直接刷榜各大图像分类任务。ResNet是一种残差网络,咱们可以把它理解为一个子网络,这个子网络经过堆叠可以构成一个很深的网络,而ResNext在其基础上,进行了一定修改完善,通过引入Cardinatity后,模型性能得到了大幅度提升。(下图是经典ResNet残差网络模块结构)


1. 通用增强网络性能的手段

一般增强一个CNN的表达能力有三种手段:

  • 一是增加网络层次即加深网络(目前CNN已经由最初Alexnet的不到十层增加到了成百上千层,而实际实验结果表明由层次提升而带来的边际准确率增加已是越来越少);

  • 二是增加网络模块宽度(可见我们之前有介绍过的Wide residual network,可宽度的增加必然会带来指数级的参数规模提升,因此它并非为主流CNN设计所认可。);

  • 三是改善CNN网络结构设计(当然在不增加模型复杂度的情况下通过改良模型设计以来提升模型性能是最理想的做法,不过其门槛则实在是太高,不然Google/Facebook/Microsoft的那些埋头设计网络/调参的哥们儿就没办法拿那么高工资了。)

2. ResNet和Resnext比较

ResNeXt的做法可归为上面三种方法的第三种。它引入了新的用于构建CNN网络的模块,而此模块又非像过去看到的Inception module那么复杂,它更是提出了一个cardinatity的概念,用于作为模型复杂度的另外一个度量。Cardinatity指的是一个block中所具有的相同分支的数目。

3. 上述网络在实际比赛的实测

根据科大讯飞几个计算机视觉任务的结果来说,那些EfficientNet、MobileNet这些网络结构对准确率的精度必然是有影响的,根据实测的几个比赛基本精度(准确率)损失在3%-5%左右。ResNext相比于其他ResNet等结构,确实在模型设计上,能够达到更准确的分类精度,至于比ResNext更复杂的经典网络IncepNetv4尚且未能测试,等后续有机会再做测试。每次测试结果为多次超参数测试后的最高值,具体实测的结果如下:

复制代码
               表1  在科大讯飞AIGC分类挑战赛2023上的实测结果
模型 准确率
MobileNetv2_s、MobileNetv2_m 95.32%
EfficientNetB1-B5 95.71%
ResNet34 98.15%
ResNext 98.53%
相关推荐
fuquxiaoguang1 分钟前
AI 重塑网页抓取:技术革新、攻防边界与未来图景
人工智能·网页抓取
C++ 老炮儿的技术栈3 分钟前
如何利用 OpenCV 将图像显示在对话框窗口上
c语言·c++·人工智能·qt·opencv·计算机视觉·github
在水一缸4 分钟前
当开源硬件撞上闭源围墙:从 Flux.ai 律师函事件看 AI 时代的爬虫法律风险与技术边界
人工智能·爬虫·开源·开源硬件·数据合规·法律风险·flux.ai
冬奇Lab6 分钟前
Agent 系列(14):Agent 可观测性——追踪每一步决策,让黑盒变透明
人工智能·llm·agent
澹锦汐7 分钟前
AI 重构工作流:赋能独立开发快速迭代的研发效能革命
人工智能
装不满的克莱因瓶8 分钟前
基于 Python 进行二维空间线性可分数据单/多层感知器实战
人工智能·python·深度学习·神经网络·ai·卷积
2601_950368919 分钟前
稀土合金粉末采购指南:3步筛选靠谱镁钆供应商
大数据·运维·人工智能·python
金融RPA机器人丨实在智能9 分钟前
最终决定选择实在Agent的关键因素通常是什么?
人工智能·ai
继续商行10 分钟前
Go 内存调优:用逃逸分析减少堆分配
人工智能
luweis14 分钟前
企智孪生 ETA (6.5 人机协同:定义“协作界面 (Collaboration UI)”)【杭州联保致新科技有限公司 卢伟舜】
网络·人工智能·科技·程序人生·创业创新·学习方法