关于VIT为啥可以用卷积代替第一层嵌入层

当卷积的步长就是块大小的时候,卷积就是全连接。

卷积和全连接的区别,卷积就是全连接。左上的三个白块是原始图像,红色的是卷积核。

将每个白块拉成长条,就是下面的,可以看到连线的w1代替了红色的卷积,也就是说卷积就是全连接。

而卷积移动时其实是全连接不停的换输入数据,这就可以解释为啥vit可以用卷积操作代替全连接,卷积核的输出维度,其实就是全连接的神经元的个数。

相关推荐
quetalangtaosha几秒前
Anomaly Detection系列(CVPR2025 DeCo-Diff论文解读)
人工智能·计算机视觉·异常检测
一只猿Hou2 分钟前
【SpringAI教程】第一阶段: AI 应用工程化(基础入门)
人工智能
财经资讯数据_灵砚智能5 分钟前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年4月7日
人工智能·python·信息可视化·自然语言处理·ai编程
AI视觉网奇8 分钟前
生成GeoGebra
人工智能·深度学习
deephub11 分钟前
向量数据库对比:Pinecone、Chroma、Weaviate 的架构与适用场景
人工智能·python·大语言模型·embedding·向量检索
SteveSenna16 分钟前
强化学习4.1:基于价值——Q-learning
人工智能·学习·算法·机器人
Linux猿17 分钟前
植物病害图像数据集 YOLO 目标检测 | 可下载
人工智能·yolo·目标检测·yolo数据集·yolo目标检测·yolo目标检测数据集·植物病害图像数据集
Cosolar19 分钟前
LangChain实战:基于Streamlit+ LangChain + Qwen 快速构建一个多会话AI聊天页面
人工智能·llm·agent
扬帆破浪26 分钟前
麒麟系统安装察元 WPS AI 文档助手:免费、开源、离线部署说明
人工智能·开源·wps
古希腊掌管代码的神THU26 分钟前
【清华代码熊】图解 Gemma 4 架构设计细节
人工智能·深度学习·自然语言处理