关于卷积神经网络的多通道

多通道输入

当输入的数据包含多个通道时,我们需要构造一个与输入通道数相同通道数的卷积核,从而能够和输入数据做卷积运算。 假设输入的形状为n∗n,通道数为ci​,卷积核的形状为f∗f,此时,每一个输入通道都应该分配一个形状为f∗f的卷积核,所以卷积核的形状可以表示为ci​∗f∗f。

从上图的实例中可以看出,多通道输入的计算方法就是单独计算每个通道中卷积的结果,再将不同通道得到的结果对应相加到一个通道,得到输出的结果。

多通道输出

当输入通道有多个时,我们增加了卷积核的通道数,并对结果进行了累加,这样不论输入通道数为多少,输出通道数都为1。所以如果我们需要增加输出的通道,就可以增加多个多通道的卷积核,每一个多通道的卷积核可以获得一个通道的输出,这样就可以获得多通道输出了。 假设卷积核的输入通道数和输出通道数分别为ci​co​,如果想要得到含多个通道的的输出,我们可以为每个输出分别创建一个形状为ci​∗f∗f的卷积核,然后在输出通道上将结果连接起来,就可以得到多通道的输出,最终卷积核的形状就是co​∗ci​∗f∗f

如何调用 Pytorch 中的多通道输入和输出

nn.Conv2d()中的参数in_channelsout_channels就是用于控制卷积层的输入通道数和输出通道数。

nn.Conv2d(1, 6, 5) # in_channels, out_channels, kernel_size
复制代码
    上方这个示例中就定义了最简单的卷积层,其中in_channels=1,out_channels=6。

习题

因为输出ci输入co分别为3、10,所以卷积核的深度为3x10,卷积核的w和h需要根据步幅和填充确定。已知输入输出形状wh不变,由公式 (n-f+2p)/s+1 = n 得到(24 - 3 + 1*2)/1 + 1 = 24 与c选项一致

相关推荐
sp_fyf_20241 小时前
【大语言模型】ACL2024论文-35 WAV2GLOSS:从语音生成插值注解文本
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·数据挖掘
AITIME论道1 小时前
论文解读 | EMNLP2024 一种用于大语言模型版本更新的学习率路径切换训练范式
人工智能·深度学习·学习·机器学习·语言模型
明明真系叻2 小时前
第二十六周机器学习笔记:PINN求正反解求PDE文献阅读——正问题
人工智能·笔记·深度学习·机器学习·1024程序员节
XianxinMao3 小时前
Transformer 架构对比:Dense、MoE 与 Hybrid-MoE 的优劣分析
深度学习·架构·transformer
88号技师4 小时前
2024年12月一区SCI-加权平均优化算法Weighted average algorithm-附Matlab免费代码
人工智能·算法·matlab·优化算法
IT猿手4 小时前
多目标应用(一):多目标麋鹿优化算法(MOEHO)求解10个工程应用,提供完整MATLAB代码
开发语言·人工智能·算法·机器学习·matlab
88号技师4 小时前
几款性能优秀的差分进化算法DE(SaDE、JADE,SHADE,LSHADE、LSHADE_SPACMA、LSHADE_EpSin)-附Matlab免费代码
开发语言·人工智能·算法·matlab·优化算法
2301_764441334 小时前
基于python语音启动电脑应用程序
人工智能·语音识别
HyperAI超神经4 小时前
未来具身智能的触觉革命!TactEdge传感器让机器人具备精细触觉感知,实现织物缺陷检测、灵巧操作控制
人工智能·深度学习·机器人·触觉传感器·中国地质大学·机器人智能感知·具身触觉
galileo20164 小时前
转化为MarkDown
人工智能