技术栈

manba

deephub
1 年前
人工智能·深度学习·神经网络·图像分类·manba
MambaOut:状态空间模型并不适合图像的分类任务该论文探讨了Mamba架构(包含状态空间模型SSM)是否有必要用于视觉任务,如图像分类、目标检测和语义分割。通过实验证实了了Mamba在视觉识别任务中的效果,认为其不如传统的卷积和注意力模型。
deephub
1 年前
人工智能·rnn·深度学习·transformer·manba
Mamba详细介绍和RNN、Transformer的架构可视化对比Transformer体系结构已经成为大型语言模型(llm)成功的主要组成部分。为了进一步改进llm,人们正在研发可能优于Transformer体系结构的新体系结构。其中一种方法是Mamba(一种状态空间模型)。