关于VIT为啥可以用卷积代替第一层嵌入层

当卷积的步长就是块大小的时候,卷积就是全连接。

卷积和全连接的区别,卷积就是全连接。左上的三个白块是原始图像,红色的是卷积核。

将每个白块拉成长条,就是下面的,可以看到连线的w1代替了红色的卷积,也就是说卷积就是全连接。

而卷积移动时其实是全连接不停的换输入数据,这就可以解释为啥vit可以用卷积操作代替全连接,卷积核的输出维度,其实就是全连接的神经元的个数。

相关推荐
小和尚同志10 分钟前
什么?oh-my-opencode 太重了?那试试 oh-my-opencode-slim
人工智能·aigc
一路往蓝-Anbo1 小时前
第 9 章:Linux 设备树 (DTS) ——屏蔽与独占外设
linux·运维·服务器·人工智能·stm32·嵌入式硬件
飞哥数智坊1 小时前
把模型焊死在芯片上,就能跑出 17,000 tokens/秒?这是一条死路,还是一条新路?
人工智能
多恩Stone1 小时前
【3D-AICG 系列-11】Trellis 2 的 Shape VAE 训练流程梳理
人工智能·pytorch·算法·3d·aigc
tuotali20261 小时前
氢气压缩机技术规范亲测案例分享
人工智能·python
Coder_Boy_2 小时前
Java(Spring AI)传统项目智能化改造——商业化真实案例(含完整核心代码+落地指南)
java·人工智能·spring boot·spring·微服务
CoderJia程序员甲2 小时前
GitHub 热榜项目 - 日榜(2026-02-23)
人工智能·ai·大模型·github·ai教程
冬奇Lab3 小时前
MCP 集成实战:连接外部世界
人工智能·ai编程·claude
罗政3 小时前
AI图片识别批量提取医疗器械铭牌信息实战
人工智能
冬奇Lab3 小时前
一天一个开源项目(第32篇):Edit-Banana - 让不可编辑的图表变成可编辑,SAM3+多模态大模型驱动
人工智能·开源·资讯