(cvpr25) MP-HSIR: 面向通用高光谱图像复原的多提示框架

论文:(cvpr25) MP-HSIR: A Multi-Prompt Framework for Universal Hyperspectral Image Restoration

作者的研究目标是构建一款适配多样退化类型和强度的通用 HSI 复原框架,同时解决光谱特征复原不足、退化建模精度低的问题。MP-HSIR 的核心是融合光谱提示、文本提示、视觉提示三模态信息,设计了提示引导的空谱 Transformer(PGSSTB)和文本 - 视觉协同提示(TVSP)两大核心模块,整体为编码器 - 解码器架构,如下图所示。

提示引导的空谱 Transformer(PGSSTB): 构建了提示引导光谱自注意力 PGSSA,如下图所示,包括全局和局部两个分支,是光谱复原的关键。提示引导局部光谱分支,将特征划分为非重叠局部块,引入可学习的光谱提示 提供通用低秩光谱模式,引导注意力聚焦关键光谱通道,提升光谱特征重建和模型泛化性。

文本 - 视觉协同提示(TVSP): 文本提示部分通过退化预测器 Φ分类输入图像退化类型,基于预训练CLIP 模型生成对应文本嵌入作为提示,同时将嵌入转化为可学习参数适配 HSI 特性;视觉提示部分引入可学习视觉提示,通过跨注意力融合文本 - 视觉提示,实现全局退化调控和局部特征细化,最终通过跳连将融合特征传入解码器。

PGSSA中的光谱提示,是通过训练学习到通用低秩光谱模式,可将任意局部光谱特征表示为该模式的线性组合,显著提升局部光谱建模性能,增强模型在不同数据集和退化场景的泛化性。

相关推荐
小宋102120 小时前
4 万 Star 的开源 ChatGPT 桌面端:用 Jan 把电脑变成离线 AI 工作站
人工智能·chatgpt·开源·jan
searchforAI20 小时前
啥是LLM?大语言模型从原理到选型的完整科普
人工智能·科技·深度学习·ai·语言模型·知识图谱·agent
我就是全世界20 小时前
具身智能难现“ChatGPT时刻”:缺统一范式,更缺优质数据
人工智能·chatgpt·机器人
bryant_meng20 小时前
【Transformer】Why ChatGPT Is Decoder-Only
深度学习·chatgpt·transformer·decoder
NQBJT20 小时前
告别复制粘贴!NQ-Assistant:一键将 DeepSeek/ChatGPT/Claude 回复导出为精美 Word 文档
人工智能
朱大喜21 小时前
数据可视化工具选型:matplotlib、Plotly 与 ECharts
人工智能
动物园猫21 小时前
直升机停机坪目标检测数据集分享(适用于YOLO系列深度学习分类检测任务)
深度学习·yolo·目标检测
染指11101 天前
26.RAG进阶(Advanced RAG)-假设性问题索引
人工智能·windows·agent·rag·advanced rag
闵孚龙1 天前
动态图机制:为什么 PyTorch 调试起来更舒服
人工智能·pytorch·python
甲维斯1 天前
还要啥Codex!DeepSeek接入Zcode远程连接!
人工智能