卷积神经网络学习问题总结

问题一: 深度学习中的损失函数和应用场景

回归任务:

均方误差函数(MSE)适用于回归任务,如预测房价、预测股票价格等。

python 复制代码
import torch.nn as nn  
loss_fn = nn.MSELoss()  

分类任务:

交叉熵损失函数(Cross-Entropy Loss)适用于分类任务,如图像分类、文本分类等。对于多分类问题,该损失函数可与Softmax激活函数结合使用。

python 复制代码
import torch.nn as nn  
loss_fn = nn.CrossEntropyLoss()  

二分类任务:

二元交叉熵损失函数(Binary Cross-Entropy Loss)适用于二分类问题,如预测是否为垃圾邮件、预测股票涨跌等。对于二分类问题,该损失函数可与Sigmoid激活函数结合使用。

python 复制代码
import torch.nn as nn  
loss_fn = nn.BCELoss() 

问题二: 空洞卷积

灰色部分为卷积核权重

白色部分为空,值为0

dilation rate:空洞率

权重值的间隔为dilation rate - 1

例:m = 3, p = 0, s = 1时

(m表示卷积核大小,p 表示零填充大小(zero-padding), s 表示步长(stride),d表示空洞率(dilation))

若d=1:

若d=2:

优点:在不增加参数的情况下增大感受野,适用于图片size较大,或需要快速感受全局信息的情况。

通过设置不同的dilation rate捕获多尺度上下文信息,适用于需要捕获图片的多层次的情况,如语义分割等。

问题:存在网格效应,远距离点之间的信息可能不相关。

解决办法:HDC

一、叠加卷积的 dilation rate 不能有大于1的公约数。如 [2, 4, 6] 则不是一个好的三层卷积,依然会出现 gridding effect。解决网格效应

二、将 dilation rate 设计成锯齿状结构,例如 [1, 2, 5, 1, 2, 5] 循环结构。同时捕获远近信息

三、满足:

最常用:

问题三: 残差网络

反向传播路径太长,训练难度增加

问题:

若卷积后的结果与输入X的shape不同, 则不能直接相加

当步长不为1,图片大小发生变化

当通道数与输入通道不同,图片通道数 发生变化

解决:

使用一个1x1的卷积核来改变X的shape,使得其能与卷积后的结果shape相匹配(不知道^ ^

残差模型VS等深卷积:

相关推荐
炽天使32818 分钟前
自建 git 服务器
服务器·git·学习·程序人生
Rookie也要加油20 分钟前
QT中文乱码解决
笔记·qt·学习
小泽耳机数码推荐家21 分钟前
无线蓝牙耳机哪个品牌好?四大热门爆款品牌推荐
python·django·virtualenv·pygame
zcg194223 分钟前
工作中常用的100个知识点
python
FL162386312923 分钟前
[数据集][目标检测]电力场景输电线均压环歪斜检测数据集VOC+YOLO格式303张2类别
人工智能·yolo·目标检测
楚轩努力变强24 分钟前
Python学习笔记(九)
开发语言·笔记·python·学习
weixin_3776348424 分钟前
python 图像去噪
开发语言·python
液态不合群30 分钟前
企业级环境部署:在 Linux 服务器上如何搭建和部署 Python 环境?
linux·服务器·python
AI大模型_学习君44 分钟前
大模型技术 | 基于 Langchain 和 Streamlit,构建多 PDF RAG 聊天机器人
人工智能·langchain·机器人·pdf·大语言模型·ai大模型·rag
昵称什么的不存在44 分钟前
Pycharm的终端(Terminal)中切换到当前项目所在的虚拟环境
ide·python·pycharm