[PyTorch][chapter 9][李宏毅深度学习][Why Deep]

前言:

我们知道深度学习一个重要特征是网络堆叠,深。 为什么需要深度,

本篇主要简单介绍一下该原因

目录:

1: 简介

2: 模块化分析

3: 语音识别例子


一 简介

有人通过实验,使用相同的网络参数,深度越深的网络相当于浅层网络效果更好。

1.1 Deeper is Better

如下图,随着网络层次逐渐加深,文本错误率逐渐降低

如下图,我们只用一层的网络,参数量跟多层一样,错误率高很多.

为什么产生这种现象?

同样的参数量,深度网络比浅层网络效果更好。


二 模块化分析

我们写程序,也把函数分为不同模块,实现不同功能

深度学习不同的层也相当于不同的函数,不同的函数实现不同的功能,

更高层也能使用到.

2.1 数据集的影响

比我我们要通过一个神经网络实现做4分类

|-------|------|
| 长头发女生 | 数据量大 |
| 长头发男生 | 数据量小 |
| 短头发女生 | 数据量大 |
| 短头发男生 | 数据量小 |

因为长头发男生数据集小,训练的网络一般会比较差。

解决方案:

使用更深层次的网络,有的用来识别男女,有的用来识别短头发长头发

然后更高层次的网络用来做4分类.

深度学习就相同于实现上面模组化的功能,每一层的神经元的输出,作为下一层神经元的输入.

我们没有足够的训练数据,所以做Deep Learning


三 语音识别例子

以发音识别为例:

输入了语音特征,输出对应的概率

在深度学习采样的模型如下:绿色模块是一些根据专家信息提取的声音

特征信息

Google 曾经做过实验:

使用深度学习的模型甚至完全不需要上面绿色的模块

可以达到前面模型一样的准确率.

11: Why Deep?_哔哩哔哩_bilibili


相关推荐
企业架构师老王4 分钟前
药品生产环节:用实在Agent自动生成批记录与打印领料单的合规设计与架构落地
大数据·人工智能·ai·架构
黎阳之光8 分钟前
视频孪生重构轨交数字孪生新范式|黎阳之光以自主核心技术破解落地难题
大数据·人工智能·算法·安全·数字孪生
ai产品老杨8 分钟前
告别重复造轮子:深度解析支持源码交付的 AI 视频平台架构,实现 X86/ARM 与 GPU/NPU 异构算力融合
人工智能·架构·音视频
写代码的小阿帆11 分钟前
AI工具使用——外挂AI插件、AI原生IDE与AI终端
ide·人工智能·ai-native
谢谢 啊sir12 分钟前
L2-060 大语言模型的推理 - java
java·人工智能·语言模型
阿杰学AI12 分钟前
AI核心知识140—大语言模型之 推理期算力(简洁且通俗易懂版)
人工智能·语言模型·自然语言处理·思维链·思维树·慢思考·推理期算力
云淡风轻~窗明几净12 分钟前
关于TSP的sealine算法与角谷猜想(2026-04-25)
数据结构·人工智能·算法·动态规划·模拟退火算法
wayz1113 分钟前
Day 13:朴素贝叶斯分类器
人工智能·算法·机器学习·朴素贝叶斯
前端摸鱼匠13 分钟前
【AI大模型春招面试题29】对比学习(Contrastive Learning)在大模型预训练中的应用?
人工智能·学习·算法·面试·大模型·求职招聘
自律小嘉同学16 分钟前
【无标题】
人工智能