为什么bn+tanh比bn+relu效果好?

在自己手搓cudnn搭建的神经网络中,bn+relu其实效果很差!

但不知为什么网络流行就是bn+relu,bn+relu虐我千百遍,失败!仅能用一次在网络中!我才意识到要用bn+tanh,然后,这个组合多达6次,也成功了!

所以我的直觉就是bn+tanh好!

是不是显卡低级,cuda和cudnn版本低的原因呢?(win10+vs2015 c++)

显卡我用mx550,1060,cuda9.0以及cudnn7.1.4

然后mx550升级为cuda10.2,cudnn7.6也不行!

其实我们潜意识都是随大流,要不自己为什么那么不入流?!

什么时间我才能bn+relu成功呢?别人早都成功了!

虽然网上搜不到解决方案,这方面不知道为啥研究的人这么少!

没有机会抄作业!而pytorch的底层你也看不到!

yolo v3能看到源码,与我没什么两样,为什么它可以,我的不可以,必须bn+tanh?

为什么pytorch这么低的起点(bn+relu)我都 做不到?

说以很无赖!无赖的在deepseek和百度搜一搜(追求一下心里平衡):bn+tanh比bn+relu好

结果如下:(心里平衡了!可能是tanh比relu更对称!)

唉,人的意识是一样的!

什么时候才能突破bn+relu?(或者leaky relu)

相关推荐
火山引擎开发者社区3 小时前
没有长期记忆,Agent 谈何持续进化?一图看懂火山 Mem0:解锁 Agent 持续学习与进化之路
人工智能
冬奇Lab7 小时前
Workflow 系列(06):安全——跨步骤注入传播与四层防御
人工智能·工作流引擎
冬奇Lab7 小时前
每日一个开源项目(第149篇):RAG-Anything - 把图片、表格、公式当成一等公民的多模态 RAG 框架
人工智能·开源
米小虾7 小时前
AI Agent 安全实战指南:当智能体开始"不听话",开发者该如何应对?
人工智能·安全·agent
IT_陈寒9 小时前
Vite的热更新突然不香了,排查三小时差点砸键盘
前端·人工智能·后端
阿里云大数据AI技术11 小时前
构建高转化海外电商搜索:阿里云OpenSearch行业算法版的全链路智能优化策略实战
人工智能·搜索引擎
Awu122711 小时前
⚡从零开发 Agent CLI(五)实现一个可治理、可扩展的工具系统
前端·人工智能·claude
字节跳动视频云技术团队11 小时前
让 Agent 成为音视频工作台:AI MediaKit CLI + Skill 发布
人工智能·音视频开发
魏祖潇11 小时前
framework 整合实战——DDD/TDD/SDD 三件套在 framework 仓的真实落地
人工智能·后端