SliMamba:十余K参数量刷新SOTA!高光谱分类的“降维打击“来了

01

论文介绍

  1. Spectral Selection Convolution and Overlapped-Centering Mamba Network for Hyperspectral Image Classification

https://ieeexplore.ieee.org/document/11359294

代码:https://github.com/flyzzie/SliMamba

02

核心思想

针对高光谱图像(HSI)中光谱波段极度丰富但也伴随海量冗余、且带标签样本极为稀缺的痛点,本文提出了一种专为高光谱分类设计的超轻量级卷积-Mamba 混合架构 SliMamba。其核心思想是"打破常规维度壁垒与强化中心先验":在特征提取前端,首创了光谱选择卷积(SSC),通过在物理层面上交换空间与光谱维度,以极低的卷积参数量实现了大感受野的跨通道特征提纯;在序列建模后端,设计了重叠中心 Mamba(OC-Mamba),将中心像素的先验知识完美嵌入到局部与全局的"蛇形扫描"序列中。该模型在将参数量压缩至极限(仅需十余 K)的同时,全面刷新了高光谱分类的 SOTA 精度。

03

背景与动机

从文本与数据特性的角度来看,高光谱图像面临着一个经典的悖论:包含数百个连续光谱波段,这提供了极致的物质辨识度,但也引发了严重的"维数灾难"和信息冗余。

现有的深度学习方法在应对这一挑战时往往陷入两难:

  • CNN 的局限:缺乏全局感受野,难以在数百个通道间建立长程的跨通道依赖。
  • ViT 的昂贵:虽然有全局视野,但注意力机制的计算复杂度呈二次方爆炸,对高维 HSI 数据极不友好。
  • 原生 Mamba 的盲区:最近火热的 Mamba 模型虽然凭借线性复杂度解决了长序列问题,但作者敏锐地发现,直接将 Mamba 扫过高光谱数据时,往往忽略了显式的跨通道依赖关系(Cross-channel dependencies)。此外,在极小样本集(Few-shot)的场景下,现有模型若想引入图像块的"中心像素先验(Center pixel prior)"来辅助定位,往往会导致网络结构急剧膨胀。

04

主要创新点

1.提出极简双分支架构 SliMamba:将原始光谱流与降维光谱流并行处理,兼顾了原始物理信息的保留与高阶语义的提取。

2.独创光谱选择卷积 (SSC):堪称全篇最惊艳的操作。它将光谱轴与空间轴进行物理对调,使得普通的空间域深度卷积(Depthwise Conv)能够直接等效于大感受野的光谱跨通道特征选择。

3.构建重叠中心 Mamba (OC-Mamba):设计了单像素重叠 SSM(O-SSM)和中心 SSM(C-SSM),通过多方向"蛇形扫描"与衰减位置编码,强制网络聚焦中心像素并捕获局部-全局拓扑关系。

4.引入中心空谱交叉注意力(CS^2CA):在 SSC 与 OC-Mamba 之间建立了一座桥梁,利用中心像素向量与全局空间向量进行多粒度的交叉引导。

05

方法细节(最重要:SliMamba 的解剖学)

5.1 整体网络架构与数据流

SliMamba 的数据流宛如一套精密的双轨分流系统:

  • **输入与分流:**高光谱图像切块后,兵分两路。一路保留原始数百个波段进入原始分支 (Original Branch);另一路通过 PCA 降维后进入降维分支 (Dimensionality-Reduction Branch)。
  • **原始分支的提纯:**特征先经过 SA-SSM(基于 Mamba 的全局光谱注意力)筛选出重要波段,随后进入SSC 模块。在这里,冗余的通道被大幅压缩,并提取出全局空间向量(GSV)。
  • **降维分支的序列化:**降维后的特征在接收了来自CS^2CA模块反馈的中心像素信息后,送入 OC-Mamba 模块,进行极其彻底的局部与全局空谱序列建模。
  • 融合与输出:两条分支的输出在尾部汇合,通过多尺度分组卷积(MSGC)完成最终的特征降维与融合,送入全连接层输出分类结果。

5.2 核心创新模块详解

模块 A:SSC(光谱选择卷积)

这是突破常规 CNN 通道建模瓶颈的杀手锏。传统方法提取通道间关系(如 SE-Net)需要庞大的全连接层,而 SSC 则进行了一次"降维打击":

  1. 维度乾坤大挪移:首先,将原始空间维度(如7\times 7)展平,并将其视为"新的光谱维度";同时将原本极长的光谱通道维度折叠成一个 2D 矩阵,视为"新的空间维度"。
  2. 深度卷积跨界提取:在这个"伪空间"上,使用多组具有不同膨胀率(Dilation=1, 2, 3)的深度3\times 3可分离卷积进行滑动。这在数学本质上,完美等效于在原光谱通道上进行了不同跨度的大感受野跨通道组合。
  3. 低成本还原:卷积完成后,再把维度交换回来。这种"借鸡生蛋"的做法,使得模型能在仅需传统卷积一半不到的参数量下,完成极度复杂的跨波段特征提取。

模块 B:OC-Mamba(重叠中心 Mamba 块)

如何让 Mamba 具有"中心意识"?OC-Mamba 设计了内外兼修的双子模块:

  • **O-SSM (单像素重叠 SSM,主攻局部):**将图像块切分为 4 个在中心区域有 1 像素重叠的子区域。从四个角开始,分别向中心点进行"蛇形扫描 (Snake Scan)"。最绝的是加入了衰减位置编码 (DPE),扫描越靠近中心,赋予的权重越高,强迫模型在局部细节中将中心像素奉为核心。
  • **C-SSM (中心 SSM,主攻全局):**将降采样后的全局特征与提取出的中心像素向量相加。随后进行全局视角的蛇形扫描。最后,局部特征与全局特征通过可学习权重动态融合,使得中心目标既有微观纹理,又有宏观环境支撑。

**理念与机制总结:**SliMamba 的设计哲学是"维度视角的降维与重构"。它深刻理解了高光谱数据X \in \mathbb{R}^{H \times W \times C} 中(通道)不仅是特征通道,更是物理频谱的本质。SSC 通过数学矩阵的转置,让普通卷积拥有了处理高维光谱序列的能力;而 OC-Mamba 则是将二维的空谱分布强制压扁为多条一维序列,但通过精心设计的扫描路径(从外向内)和位置编码,人为地在这条一维序列中刻画出了二维图像中的"中心焦点"。

06

即插即用模块的作用与应用场景

论文中极其精致的子模块具有极高的通用价值,完全可以作为即插即用(Plug-and-Play)组件快速迁移到其他遥感或医疗任务中:

  • SSC (光谱选择卷积):
    • 适用场景:任何输入数据具有极高通道维度,且通道之间存在高度冗余物理关联,同时硬件部署算力极度受限的场景。
    • 具体应用:医学影像中的高维 fMRI(功能性核磁共振)数据分析、多光谱无人机农业病害检测。可以直接用 SSC 替换掉网络中的1\times 1 降维卷积,在几乎不增加算力的前提下实现极佳的波段自适应选择。
  • O-SSM (带衰减位置编码的重叠蛇形扫描 Mamba):
    • 适用场景:所有对"中心锚点目标"极其敏感的 Patch-Level 密集分类或小目标检测任务。
    • 具体应用:不仅限于高光谱,在雷达 SAR 图像的小型舰船切片识别、或者病理切片中的单细胞恶性分类中,O-SSM 的"向心式扫描"机制能够完美摒弃背景杂波,死死咬住视野中心的待检测实体。

07

实验部分简单分析

在 Houston、Trento、WHU-Hi-HongHu 等四个权威高光谱基准数据集上的实验结果,堪称一场"四两拨千斤"的视觉盛宴:

**1.参数量与精度的魔幻倒挂:**在 WHU-Hi-HongHu 数据集上,SliMamba 以 不到 20K 的极致参数量和仅 1.0M 左右的 FLOPs,不仅击溃了庞大的 CNN 基线,甚至在 OA(总体精度)上超越了参数量高达 1900K 的大型 Transformer 和纯 Mamba 模型。

**2.分类边界的视觉碾压:**从可视化的分类结果图来看,其他对比方法在相似地物(如不同种类的植被或道路边缘)经常出现大面积的"椒盐噪声"或误分类斑块。而 SliMamba 凭借 SSC 强大的波段过滤与 OC-Mamba 精准的中心先验锚定,输出的分类图不仅色块纯净,地物边界的锐利度更是极其贴近真实标签(Ground Truth)。

**3.核心模块的绝对效用:**消融实验直接证明了其设计的紧凑性。去掉任何一个组件(特别是 SSC 内部的维度切换机制或 OC-Mamba 的局部扫描分支),都会导致精度的显著下滑,充分说明该架构中没有一丝多余的"水分"。

总结:SliMamba 不仅是一篇技术极其扎实的顶刊论文,更为后续大火的 Mamba 模型如何低成本、高效率地处理高维物理特征提供了极为宝贵的工程蓝本。强烈建议所有从事多模态/多通道视觉任务的开发者深入研究!

相关推荐
_codemonster2 小时前
被子植物门 —— 纲、目、科详细梳理 + 分类依据
人工智能·分类·数据挖掘
yoothey2 小时前
Java字节流与字符流核心笔记(问答+考点复盘)
java·开发语言·笔记
black方块cxy3 小时前
实现一个输入框多个ip以逗号分隔最多20组,且ip不能重复
java·服务器·前端
RoboWizard3 小时前
本地AI主机批量部署 高效存储支撑全场景配置
大数据·人工智能
你真是饿了3 小时前
算法专题二:滑动窗口
算法
dingzd953 小时前
产品同质化严重如何用材质升级做出溢价空间
大数据·人工智能·跨境电商·内容营销
ccLianLian3 小时前
数论·约数
数据结构·算法
@PHARAOH3 小时前
WHAT - AI 时代下的候选人
大数据·前端·人工智能
会编程的土豆3 小时前
【数据结构与算法】最短路径---Dijkstra 算法
数据结构·c++·算法