2025暑期—06神经网络-常见网络2

ALEXNET

11X11X3 三维卷积核,步长为4 第一层使用96个11X11X3的卷积核,最后得到的维度为 55X55X96 96 个通道。

第三个卷积、第四、第五是连续在一起做了。卷积有5层,池化有3层。通道数有空前提高。随着卷积向前,图像越来越小,通道越来越多。而且多次卷积再做一次池化。6X6X256=9216

11X11X3+1 364 *96=35K

第一层是基本特征,然后是特征的组合,然后一点一点组合逐渐形成认知部分,以汽车为例,首先是边缘及纹理特征,然后是这些特征的组合,再抽象变成轮胎、车身,最后再抽象为汽车。

相关推荐
EEG小佬9 分钟前
KAN(Kolmogorov-Arnold Networks)通俗理解
人工智能·python·深度学习·神经网络
7hyya24 分钟前
如何将Spring Boot 2接口改造为MCP服务,供大模型调用!
人工智能·spring boot·后端
. . . . .44 分钟前
GPT的前世今生及发展
人工智能·gpt
DatGuy2 小时前
Week 19: 深度学习补遗:自注意力和Transformer Encoder架构
人工智能·深度学习·transformer
艾菜籽2 小时前
网络原理-HTTP补充2
网络·网络协议·http
colus_SEU2 小时前
【循环神经网络5】GRU模型实战,从零开始构建文本生成器
人工智能·rnn·深度学习·gru
Penguin大阪2 小时前
GRU模型这波牛市应用股价预测
人工智能·深度学习·gru
格林威2 小时前
UV紫外相机在工业视觉检测中的应用
人工智能·深度学习·数码相机·算法·计算机视觉·视觉检测·uv
格林威2 小时前
工业视觉检测里的 “柔性” 是什么?
图像处理·人工智能·深度学习·yolo·计算机视觉·视觉检测
丁学文武2 小时前
大模型原理与实践:第三章-预训练语言模型详解_第3部分-Decoder-Only(GPT、LLama、GLM)
人工智能·gpt·语言模型·自然语言处理·大模型·llama·glm