李宏毅深度学习--如何做到鱼与熊掌兼得

兼得也就是:在比较少的参数量的情况下得到较低的Loss
下面主要是对比:

为什么网络更深比网络更宽会更好

获得分段的function,分的段越多,得到的函数就越接近真实的

分段+常数+一些分段函数的sum

如何制造阶梯型的function

  • sigmoid function

每个neuron产生一个阶梯型的function

只要有足够多的neuron,就可以产生任何形状的piecewis function

ReLU

为什么我们要深层网络,而不是扩展网络的宽度

网络越深,错误率越低

同样的参数量的时候,把一层的结点数变多,不如把网络变深

在产生同样的function的时候,矮胖的网络比高瘦的网络需要更多的参数量

example

接入第二层

接入第三层

  • Deep:(2^k个线段)一层2个neuron,总共三层,总共6个neuron
  • Shallow:(2^k个线段)只一层,一个neuron只能产生一个线段,2^k个线段就需要2^k个neuron

exponentially:需要多的参数量的意思

相关推荐
小王毕业啦6 分钟前
2022年 国内税务年鉴PDF电子版Excel
大数据·人工智能·数据挖掘·数据分析·数据统计·年鉴·社科数据
12960045226 分钟前
机器翻译模型笔记
人工智能·笔记·机器翻译
superior tigre37 分钟前
RNN循环网络:给AI装上“记忆“(superior哥AI系列第5期)
人工智能·rnn·深度学习
s153351 小时前
8.RV1126-OPENCV 视频中添加LOGO
人工智能·opencv·音视频
TextIn智能文档云平台1 小时前
从OCR到Document Parsing,AI时代的非结构化数据处理发生了什么改变?
人工智能·自然语言处理·ocr·pdf解析·textin·复杂文档解析
(・Д・)ノ1 小时前
python打卡day44
人工智能·python·机器学习
MiaoChuPPT1 小时前
秒出PPT正式改名秒出AI,开启AI赋能新体验!
人工智能·powerpoint
引量AI2 小时前
如何用AI高效运营1000+Tiktok矩阵账号
人工智能·矩阵·自动化·tiktok矩阵·海外社媒
视觉语言导航2 小时前
低空城市场景下的多无人机任务规划与动态协调!CoordField:无人机任务分配的智能协调场
人工智能·深度学习·无人机·具身智能
硬核隔壁老王2 小时前
一篇文章带你快速理解 MCP
人工智能·程序员·llm