每天五分钟计算机视觉:使用1*1卷积层来改变输入层的通道数量

本文重点

在卷积神经网络中有很多重要的卷积核,比如1*1的卷积核,3*3的卷积核,本文将讲解1*1的卷积核的使用,它在卷积神经网络中具有重要的地位。由于1*1的卷积核使用了最小的窗口,那么1*1的卷积核就失去了卷积层可以识别高和宽维度上相邻元素构成的模式的功能。所以1*1的卷积核的主要计算发生在通道维上。

使用1*1卷积完成通道压缩

对于一个 28×28×192 的输入层,我们可以使用池化层压缩它的高度和宽度 ,但如果通道数量很大,如何才能压缩通道呢?

该如何把28×28×192压缩为 28×28×32 维度呢?你可以用 32个大小为 1×1×192 的过滤器,也就是说你使用了 32 个过滤器,输出层为 28×28×32,这就是压缩通道数(nc)的方法。

我们可以认为1×1 卷积只是添加了非线性函数,所以让网络学习更复杂的函数,我们可以再添加一层使用192个大小为 1×1*192的过滤器,其输入为 28×28×192,输出为 28×28×192。这样输入和输出的维度是一样的,都是28×28×192,但是后面的输出比前面的输入可以认为提取到了更加复杂的特征。

相关推荐
晨非辰1 天前
【数据结构初阶系列】归并排序全透视:从算法原理全分析到源码实战应用
运维·c语言·数据结构·c++·人工智能·python·深度学习
菠菠萝宝1 天前
【Java手搓RAGFlow】-3- 用户认证与权限管理
java·开发语言·人工智能·llm·openai·qwen·rag
youngfengying1 天前
《轻量化 Transformers:开启计算机视觉新篇》
人工智能·计算机视觉
搞科研的小刘选手1 天前
【同济大学主办】第十一届能源资源与环境工程研究进展国际学术会议(ICAESEE 2025)
大数据·人工智能·能源·材质·材料工程·地理信息
MARS_AI_1 天前
云蝠智能 VoiceAgent 2.0:全栈语音交互能力升级
人工智能·自然语言处理·交互·信息与通信·agi
top_designer1 天前
Substance 3D Stager:电商“虚拟摄影”工作流
人工智能·3d·设计模式·prompt·技术美术·教育电商·游戏美术
雷神大青椒1 天前
离别的十字路口: 是否还记得曾经追求的梦想
人工智能·程序人生·职场和发展·玩游戏
m0_650108241 天前
多模态大模型 VS. 图像视频生成模型浅析
人工智能·技术边界与协同·mllm与生成模型·技术浅谈
ai_xiaogui1 天前
Mac苹果版Krita AI一键安装教程:AIStarter+ComfyUI零基础部署全流程(X86/ARM双架构)
arm开发·人工智能·macos·comfyui·一键部署·ai绘画教程·kritaai
lapiii3581 天前
[智能体设计模式] 第11章:目标设定与监控模式
人工智能·设计模式