关于卷积神经网络的多通道

多通道输入

当输入的数据包含多个通道时,我们需要构造一个与输入通道数相同通道数的卷积核,从而能够和输入数据做卷积运算。 假设输入的形状为n∗n,通道数为ci​,卷积核的形状为f∗f,此时,每一个输入通道都应该分配一个形状为f∗f的卷积核,所以卷积核的形状可以表示为ci​∗f∗f。

从上图的实例中可以看出,多通道输入的计算方法就是单独计算每个通道中卷积的结果,再将不同通道得到的结果对应相加到一个通道,得到输出的结果。

多通道输出

当输入通道有多个时,我们增加了卷积核的通道数,并对结果进行了累加,这样不论输入通道数为多少,输出通道数都为1。所以如果我们需要增加输出的通道,就可以增加多个多通道的卷积核,每一个多通道的卷积核可以获得一个通道的输出,这样就可以获得多通道输出了。 假设卷积核的输入通道数和输出通道数分别为ci​co​,如果想要得到含多个通道的的输出,我们可以为每个输出分别创建一个形状为ci​∗f∗f的卷积核,然后在输出通道上将结果连接起来,就可以得到多通道的输出,最终卷积核的形状就是co​∗ci​∗f∗f

如何调用 Pytorch 中的多通道输入和输出

nn.Conv2d()中的参数in_channelsout_channels就是用于控制卷积层的输入通道数和输出通道数。

复制代码
nn.Conv2d(1, 6, 5) # in_channels, out_channels, kernel_size
复制代码
    上方这个示例中就定义了最简单的卷积层,其中in_channels=1,out_channels=6。

习题

因为输出ci输入co分别为3、10,所以卷积核的深度为3x10,卷积核的w和h需要根据步幅和填充确定。已知输入输出形状wh不变,由公式 (n-f+2p)/s+1 = n 得到(24 - 3 + 1*2)/1 + 1 = 24 与c选项一致

相关推荐
勾股导航14 分钟前
大模型Skill
人工智能·python·机器学习
卷福同学2 小时前
【养虾日记】Openclaw操作浏览器自动化发文
人工智能·后端·算法
春日见3 小时前
如何入门端到端自动驾驶?
linux·人工智能·算法·机器学习·自动驾驶
光锥智能3 小时前
从自动驾驶到 AI 能力体系,元戎启行 GTC 发布基座模型新进展
人工智能
luoganttcc3 小时前
自动驾驶 世界模型 有哪些
人工智能·机器学习·自动驾驶
潘高3 小时前
10分钟教你手撸一个小龙虾(OpenClaw)
人工智能
禁默3 小时前
光学与机器视觉:解锁“机器之眼”的核心密码-《第五届光学与机器视觉国际学术会议(ICOMV 2026)》
人工智能·计算机视觉·光学
2401_876907523 小时前
Python机器学习实践指南
开发语言·python·机器学习
深小乐3 小时前
不是DeepSeek V4!这两个神秘的 Hunter 模型竟然来自小米
人工智能
laozhao4323 小时前
科大讯飞中标教育管理应用升级开发项目
大数据·人工智能