李宏毅深度学习--如何做到鱼与熊掌兼得

兼得也就是:在比较少的参数量的情况下得到较低的Loss
下面主要是对比:

为什么网络更深比网络更宽会更好

获得分段的function,分的段越多,得到的函数就越接近真实的

分段+常数+一些分段函数的sum

如何制造阶梯型的function

  • sigmoid function

每个neuron产生一个阶梯型的function

只要有足够多的neuron,就可以产生任何形状的piecewis function

ReLU

为什么我们要深层网络,而不是扩展网络的宽度

网络越深,错误率越低

同样的参数量的时候,把一层的结点数变多,不如把网络变深

在产生同样的function的时候,矮胖的网络比高瘦的网络需要更多的参数量

example

接入第二层

接入第三层

  • Deep:(2^k个线段)一层2个neuron,总共三层,总共6个neuron
  • Shallow:(2^k个线段)只一层,一个neuron只能产生一个线段,2^k个线段就需要2^k个neuron

exponentially:需要多的参数量的意思

相关推荐
朴马丁10 小时前
预制菜的“数字厨房”:PLM如何支撑菜品标准化与供应链高效协同?
大数据·人工智能·食品行业·流程行业plm
小沈同学呀10 小时前
SpringAI+MCPServer实战-StreamableHTTP协议打造企业级AI工具服务
人工智能·微服务架构·springai·mcpserver·javaai·streamablehttp
net3m3310 小时前
一阶软件低通滤波器算法
人工智能·算法
武汉唯众智创11 小时前
边缘端部署 AI 心理分析:自研边缘主机跑通人脸 + 语音双模态推理,不用云端算力详解
人工智能·ai心理健康·校园心理健康·多模态推理·人脸情绪识别·语音情感分析·心理健康信息化平台
IT_陈寒11 小时前
Python的线程池把我坑惨了,原来异步不是万能的
前端·人工智能·后端
水木流年追梦11 小时前
大模型入门-大模型优化方法12-YaRN 长文本外推技术
人工智能·分布式·算法·正则表达式·prompt
Litluecat11 小时前
2026年6月6日科技热点新闻
人工智能·科技·热点·每日
小旭952711 小时前
Spring AI Alibaba 从入门到实战:一站式掌握企业级 AI 应用开发
java·人工智能·spring
tianxiaxue111 小时前
企微如何使用AI生成推荐话术?
人工智能·企业微信
团象科技11 小时前
梳理中小出海独立站落地阶段关于WordPress 海外主机的实操参考路径
人工智能·深度学习