2025暑期—06神经网络-常见网络2

ALEXNET

11X11X3 三维卷积核,步长为4 第一层使用96个11X11X3的卷积核,最后得到的维度为 55X55X96 96 个通道。

第三个卷积、第四、第五是连续在一起做了。卷积有5层,池化有3层。通道数有空前提高。随着卷积向前,图像越来越小,通道越来越多。而且多次卷积再做一次池化。6X6X256=9216

11X11X3+1 364 *96=35K

第一层是基本特征,然后是特征的组合,然后一点一点组合逐渐形成认知部分,以汽车为例,首先是边缘及纹理特征,然后是这些特征的组合,再抽象变成轮胎、车身,最后再抽象为汽车。

相关推荐
闲看云起12 小时前
从BERT到T5:为什么说T5是NLP的“大一统者”?
人工智能·语言模型·transformer
小麦矩阵系统永久免费12 小时前
小麦矩阵系统:让短视频分发实现抖音快手小红书全覆盖
大数据·人工智能·矩阵
新加坡内哥谈技术12 小时前
Chrome的“无处不在”与推动Web平台演进的使命
人工智能
kailp12 小时前
突破效率与质量边界:深入解析MiniMax-Remover视频物体移除方案
人工智能·ai·大模型·gpu算力·图片渲染
超人不会飛12 小时前
vue3 markdown组件|大模型应用专用
前端·vue.js·人工智能
wanhengidc12 小时前
什么是云手机?
运维·网络·安全·游戏·智能手机
虫无涯12 小时前
Doc2X为一切AI文档服务的基础设施,将PDF转换为Word、HTML、LaTeX、Markdown等
人工智能
倔强的石头10612 小时前
卷积神经网络(CNN):从图像识别原理到实战应用的深度解析
人工智能·神经网络·cnn
爆改模型12 小时前
【ICCV2025】计算机视觉|即插即用|ESC:颠覆Transformer!超强平替,ESC模块性能炸裂!
人工智能·计算机视觉·transformer
机器人梦想家13 小时前
pymodbus启动一个简单的modbus tcp server
网络·网络协议·tcp/ip