吴恩达深度学习(9)

经典的神经网络:

残差网络(ResNet)

太深的神经网络容易出现梯度消失与梯度爆炸等问题。

跳跃连接,能从一层中得到激活并将其传递给下一层,甚至更深的网络层。利用这个可以训练网络层很深很深的残差网络(ResNet:使用了残差结构的网络)。

为什么使用残差网络

上述证明意味着残差块比较容易学习恒等函数,添加残差块到中间或者尾部并不影响网络的表现。残差网络两个有效性在于:让额外层学习起恒等函数非常简单,并且总能保证他几乎不会影响总体的表现,有时候甚至可以提升网络的表现。

网络中的网络与1X1卷积

1X1卷积可以做什么

改变长和宽的大小,可以通过池化层实现,想改变通道数,需要通过1X1卷积

初始网络动机:

使用1X1可以降低计算成本,只要使用合理,不会对数据造成影响。

初始网络(Inception)

Inception模块的输入一般是激活值,或者是来自上一个的输出。

Inception网络就是多次重复使用Inception模块

MobileNets网络(深度可分离卷积):可以大大减小计算量

深度可分离卷积由深度卷积逐点卷积两个部分构成

  • 首先要看一下深度卷积

  • 接下来要看逐点卷积:

用1X1X3的核,先相乘再相加。一共用5个核

网络的升级:加入残差网络、在块前加入一个扩展层

EfficientNet网络:根据条件,调整网络的大小

使用开源码:

迁移学习:

可以下载训练好权重的网络迁移到自己的任务上,

数据增强的方法:

1、镜像、裁剪、旋转、局部弯曲

2、色彩变化(在红、绿、蓝通道上加上扰动)、PCA色彩增强

相关推荐
hzp66615 分钟前
基于大语言模型(LLM)的多智能体应用的新型服务框架——Tokencake
人工智能·语言模型·大模型·llm·智能体·tokencake
摘星编程18 分钟前
昇腾NPU性能调优实战:INT8+批处理优化Mistral-7B全记录
人工智能·华为·gitcode·昇腾
中科岩创22 分钟前
陕西某地煤矿铁塔自动化监测服务项目
人工智能·物联网·自动化
亚马逊云开发者26 分钟前
Agentic AI基础设施实践经验系列(三):Agent记忆模块的最佳实践
人工智能
小花皮猪29 分钟前
多模态 AI 时代的数据困局与机遇,Bright Data 赋能LLM 训练以及AEO场景
人工智能·多模态·ai代理·aeo
爱吃烤鸡翅的酸菜鱼37 分钟前
深度解析《AI+Java编程入门》:一本为零基础重构的Java学习路径
java·人工智能·后端·ai
snakecy41 分钟前
智能家居技术发展与应用综述
人工智能·区块链
飞哥数智坊41 分钟前
实测 TRAE SOLO 新模型:半小时搓出一个能用的抽奖系统
人工智能·trae·solo
Juchecar1 小时前
母语,塑造和构成了我们的思维过程本身
人工智能
苏打水com1 小时前
0基础学前端:100天拿offer实战课(第3天)—— CSS基础美化:给网页“精装修”的5大核心技巧
人工智能·python·tensorflow