李宏毅深度学习--如何做到鱼与熊掌兼得

兼得也就是:在比较少的参数量的情况下得到较低的Loss
下面主要是对比:

为什么网络更深比网络更宽会更好

获得分段的function,分的段越多,得到的函数就越接近真实的

分段+常数+一些分段函数的sum

如何制造阶梯型的function

  • sigmoid function

每个neuron产生一个阶梯型的function

只要有足够多的neuron,就可以产生任何形状的piecewis function

ReLU

为什么我们要深层网络,而不是扩展网络的宽度

网络越深,错误率越低

同样的参数量的时候,把一层的结点数变多,不如把网络变深

在产生同样的function的时候,矮胖的网络比高瘦的网络需要更多的参数量

example

接入第二层

接入第三层

  • Deep:(2^k个线段)一层2个neuron,总共三层,总共6个neuron
  • Shallow:(2^k个线段)只一层,一个neuron只能产生一个线段,2^k个线段就需要2^k个neuron

exponentially:需要多的参数量的意思

相关推荐
优选资源分享20 分钟前
Motrix Next 3.4.2 丨开源多线程下载重构工具
人工智能·下载工具
草莓泰面包21 分钟前
虚拟机VMware安装OpenClaw
人工智能·ai·大模型·openclaw
qq_4542450321 分钟前
重构的逻辑:从等价变换到行为改进
人工智能·重构
zhangfeng113329 分钟前
国家超算中心 命令行是否会消耗算力卡,找不到显卡,是否需要退出
人工智能·深度学习
大榕树信息科技41 分钟前
动环监控系统提升机房管理的智能化与人性化体验
数据库·人工智能·信息可视化·数据中心·动环监控系统
renhongxia11 小时前
PostTrainBench:LLM 代理能否自动化 LLM 后培训?
运维·人工智能·深度学习·机器学习·架构·自动化·transformer
元智启1 小时前
企业AI智能体进阶:从“单点应用”到“协同网络”,重构业务流程的三种模式
人工智能·重构
不饿吗1 小时前
在 CentOS 7.9 上安装 OpenClaw:完整指南(此文章由openclaw生成)
人工智能
UXbot1 小时前
为什么 AI 正在重新定义 UI 设计工具的入门门槛
前端·人工智能·低代码·ui·交互·ai编程·ux