为什么bn+tanh比bn+relu效果好?

在自己手搓cudnn搭建的神经网络中,bn+relu其实效果很差!

但不知为什么网络流行就是bn+relu,bn+relu虐我千百遍,失败!仅能用一次在网络中!我才意识到要用bn+tanh,然后,这个组合多达6次,也成功了!

所以我的直觉就是bn+tanh好!

是不是显卡低级,cuda和cudnn版本低的原因呢?(win10+vs2015 c++)

显卡我用mx550,1060,cuda9.0以及cudnn7.1.4

然后mx550升级为cuda10.2,cudnn7.6也不行!

其实我们潜意识都是随大流,要不自己为什么那么不入流?!

什么时间我才能bn+relu成功呢?别人早都成功了!

虽然网上搜不到解决方案,这方面不知道为啥研究的人这么少!

没有机会抄作业!而pytorch的底层你也看不到!

yolo v3能看到源码,与我没什么两样,为什么它可以,我的不可以,必须bn+tanh?

为什么pytorch这么低的起点(bn+relu)我都 做不到?

说以很无赖!无赖的在deepseek和百度搜一搜(追求一下心里平衡):bn+tanh比bn+relu好

结果如下:(心里平衡了!可能是tanh比relu更对称!)

唉,人的意识是一样的!

什么时候才能突破bn+relu?(或者leaky relu)

相关推荐
多年小白几秒前
复盘】2026年5月21日(周四)
大数据·人工智能·ai·金融·区块链
南屹川几秒前
【并发编程】Python异步编程实战:从协程到异步框架
人工智能
BU摆烂会噶1 分钟前
【LangGraph】House_Agent 实战(四):预定流程 —— 中断与人工干预
android·人工智能·python·langchain
AI技术控2 分钟前
LangChain 是什么?从零开始学会 LangChain 的工程实践指南
人工智能·语言模型·自然语言处理·langchain·nlp
陈天伟教授3 分钟前
图解人工智能(32)深度学习前沿
人工智能·深度学习
RSTJ_16253 分钟前
PYTHON+AI LLM DAY FIFITY-TWO
人工智能
Ting-yu3 分钟前
Spring AI Alibaba零基础速成(5) ---- Memory(记忆)
java·人工智能·后端·spring
幂律智能6 分钟前
从AI使用风险到合同智能审查重构企业风控能力
人工智能·重构
视***间14 分钟前
端侧大模型落地新标杆:视程空间将GPT-OSS边缘AI深度导入NVIDIA Jetson平台
人工智能·gpt·边缘计算·nvidia·ai算力·gpt-oss·视程空间
1892280486128 分钟前
NY379固态MT29F32T08GSLBHL8-36QA:B
大数据·服务器·人工智能·科技·缓存