【论文阅读】Pay Attention to MLPs

作者:Google Research, Brain Team

泛读:只关注其中cv的论述

提出了一个简单的网络架构,gMLP,基于门控的MLPs,并表明它可以像Transformers一样在关键语言和视觉应用中发挥作用

提出了一个基于MLP的没有self-attention结构名为gMLP,仅仅存在静态参数化的通道映射(channel projections)和空间映射(spatial projections)

gMLP由 L 个如上图所示的模块堆叠而成

具有空间门控单元(SGU)的gMLP架构的概述。该模型由具有相同结构和大小的L个块的堆叠组成。所有的投影运算都是线性的," ⊙" 指的是逐元素乘法(线性门控)

CV上,使用gMLP做图片分类并在ImageNet上取得了与DeiT、ViT等Transformer模型相当的效果。与先前的MLP模型MLP-Mixer相比,gMLP做到了参数更少(参数减少66%)效果更强(效果提升3%)

总的来说,研究了Transformers关键语言和视觉应用中自我注意模块的必要性。具体来说,提出了一种基于mlp的Transformers替代方案,其中没有自我注意,它只是由通道投影和静态参数化的空间投影组成。我们对这种结构的几个设计选择进行了实验,发现当空间投影是线性的并与乘法门控配对时,效果很好。该模型命名为gMLP,因为它是由带有门控的基本MLP层构建而成的。

相关推荐
大磕学家ZYX39 分钟前
JavaScript学习笔记
javascript·笔记·学习
囚生CY8 小时前
【学习笔记】Langchain基础(二)
笔记·学习·langchain
忘川w12 小时前
《网络安全与防护》知识点复习
笔记·安全·web安全·网络安全
zkinglin12 小时前
AORSA编译指南
笔记·其他·能源
wu~97014 小时前
计算机网络-自顶向下—第一章概述重点复习笔记
笔记·计算机网络
李元豪16 小时前
【行云流水AI笔记】根据上面泳道图,请问如果加入强化学习,在哪些模块添加比较好,返回添加后的泳道图。
人工智能·笔记
羊小猪~~16 小时前
数据库学习笔记(十六)--控住流程与游标
数据库·笔记·学习
程序员Xu16 小时前
【大厂机试题解法笔记】恢复数字序列
笔记·算法·深度优先
张较瘦_17 小时前
[论文阅读] 人工智能 | Gen-n-Val:利用代理技术革新计算机视觉数据生成
论文阅读·人工智能·计算机视觉
wu~97017 小时前
计算机网络-自顶向下—第三章运输层重点复习笔记
网络·笔记·计算机网络