为什么bn+tanh比bn+relu效果好?

在自己手搓cudnn搭建的神经网络中,bn+relu其实效果很差!

但不知为什么网络流行就是bn+relu,bn+relu虐我千百遍,失败!仅能用一次在网络中!我才意识到要用bn+tanh,然后,这个组合多达6次,也成功了!

所以我的直觉就是bn+tanh好!

是不是显卡低级,cuda和cudnn版本低的原因呢?(win10+vs2015 c++)

显卡我用mx550,1060,cuda9.0以及cudnn7.1.4

然后mx550升级为cuda10.2,cudnn7.6也不行!

其实我们潜意识都是随大流,要不自己为什么那么不入流?!

什么时间我才能bn+relu成功呢?别人早都成功了!

虽然网上搜不到解决方案,这方面不知道为啥研究的人这么少!

没有机会抄作业!而pytorch的底层你也看不到!

yolo v3能看到源码,与我没什么两样,为什么它可以,我的不可以,必须bn+tanh?

为什么pytorch这么低的起点(bn+relu)我都 做不到?

说以很无赖!无赖的在deepseek和百度搜一搜(追求一下心里平衡):bn+tanh比bn+relu好

结果如下:(心里平衡了!可能是tanh比relu更对称!)

唉,人的意识是一样的!

什么时候才能突破bn+relu?(或者leaky relu)

相关推荐
器灵科技几秒前
DeepSeek V4 Pro宣称:超GPT-5.5+永久降价75%
大数据·人工智能·gpt·阿里云·ai·语言模型
xhtdj几秒前
技术采用曲线回望二十年
运维·数据库·人工智能·clickhouse·动态规划
fa_lsyk3 分钟前
Claude Codde 入门教程—— 从零到独立完成项目
人工智能
elirlove13 分钟前
AI制作视频的关键点:从模型到工作流的完整技术解析
人工智能·音视频
不爱土豆唯爱马铃薯4 分钟前
MonkeyCode 用户邀请计划现已正式升级 [特殊字符][特殊字符]
人工智能
小丶舟5 分钟前
Claude Fable 5首发深度解析:SWE-Bench甩GPT-5.5近20分,开发者上手的5个关键细节
人工智能·gpt
小糖学代码5 分钟前
机器学习:7.支持向量机(SVM)下
人工智能·机器学习·支持向量机
码农小旋风6 分钟前
Claude Fable 5 和 Opus 4.8 怎么选:性能、价格和场景一次讲清
人工智能·chatgpt·claude
IT_陈寒7 分钟前
Java的ArrayList扩容把我坑惨了,原来是这样搞的
前端·人工智能·后端
运维小子10 分钟前
Codex 完整指南(一):OpenAI 的全能 AI 工作台
人工智能·chatgpt