高光谱成像(七)线性光谱混合模型 LMM

上一篇中,我们介绍了 MF。在其推导过程中,我们对像素进行了如下建模:

\[\mathbf{x} = \alpha \mathbf{s} + \mathbf{b} \]

当时,我们解释这种建模可以分离目标信号和背景信号,直观来看,这个公式的逻辑就是:

\[像素光谱=目标光谱+其他干扰 \]

但是,这里还有一个我们一直没有展开的符号,那就是:\(\alpha\)

在上一篇中,我们将其解释为目标在该像素中的强度 ,那这个好像没什么存在感的系数是怎么来的?为什么感觉好像有没有都一样?

显然,\(\alpha\) 并不是凭空出现的,它有着明确的物理和数学意义。

要解释 \(\alpha\),就要涉及到高光谱遥感中的一个非常重要的理论框架,那就是线性光谱混合模型(Linear Spectral Mixing Model, LMM)

1. LLM 起源和地位

LLM 的起源可以追溯到高光谱遥感发展的早期阶段。1995 年,论文 Mapping Target Signatures via Partial Unmixing of AVIRIS Data 提出了 部分解混(Partial Unmixing) 的方法,引入了 端元(Endmember)丰度(Abundance) 的概念,用于从混合像素中分离出目标光谱。这一方法奠定了现代高光谱影像分析中 解混(Spectral Unmixing) 的基础,并在目标检测、定量分析以及环境监测中得到广泛应用。

随后,2002 年,论文Spectral Unmixing 对光谱解混进行了系统总结,将 LMM 从早期实践经验上升为完整的理论框架,为现代高光谱分析提供了可解释、可量化且标准化的理论基础

即使在现在,LMM 仍然是高光谱分析中不可替代的主流工具,即便面对复杂非线性场景,它也常作为基线方法使用,同时为稀疏解混、深度学习解混网络以及 MF/ACE 等现代方法提供理论支撑。

出现了很多没见过的词,下面,我们就来一一展开。

2. LLM 的核心思想

结合物理常识,先从我们的生活中来举个例子:

首先,光是会反射的,我们看到一朵红色的玫瑰,是因为玫瑰本身的材料主要反射红色光,这些反射光会进入我们的眼中,从而让我们看到玫瑰。

但是,我们看到玫瑰是红色的,不代表反射进我们眼里的光全来自玫瑰 。周围环境也会对我们看到的颜色产生影响:阳光的颜色、空气中悬浮的灰尘、旁边绿叶的反射光,都会混合进我们最终观察到的光线中。

总结一下:我们眼中的光,是多种材料反射光的混合

我们的眼睛是这样,高光谱相机的镜头也是这样,可能某个像素看起来是植物,但其光谱特征其实是植物、土壤、水体的混合,只是植物所占比例更大而已。

这就是 LLM 的核心思想:

每个高光谱像素的光谱可以看作由若干"纯材料光谱"按一定比例线性叠加而成。

基于这一理念,我们就可以使用数学方法把"混合光谱"进行"拆分",这个过程就是上面提到的"解混 "。由此,便衍生出端元丰度两个概念:

2.1 端元(Endmember)

所谓端元 ,指的是某一种材料在理想情况下的纯光谱特征。换句话说,如果一个像素只包含单一材料,那么该像素的光谱就可以看作这一材料的端元光谱。

在遥感场景中,往往会出现很多材料,如植被、土壤、水体、混凝土、矿物等等,获取这些材料在各个波段上的反射率曲线,那么这些光谱就可以作为端元光谱

2.2 丰度(Abundance)

丰度的概念也不难理解,如果说端元描述的是有哪些材料参与了混合 ,那么丰度描述的就是:

每种材料在该像素中所占的比例或贡献程度。

举个例子,假定某个像素的组成如下:

材料 丰度
植被 0.6
土壤 0.3
阴影 0.1

这表示该像素中: 60% 的光谱来自植被、30% 来自土壤、10% 来自阴影。

这里要说明一点:端元不仅限于物质材料,任何对像素光谱有系统贡献的因素(包括阴影、雪、湿度等)都可以作为端元

在实际应用中,丰度通常满足两个基本约束条件:

  1. 非负约束:材料的比例不可能为负。
  2. 和为一约束:所有材料的贡献比例加起来等于 1,也就是一个像素的全部组成。

了解了端元和丰度两个基本概念后,我们便可以引出 LLM 的数学形式。

3. LLM 的表达式

知道了端元和丰度的定义后,现在,每个像素的光谱就可以表示为端元光谱的线性组合

由此,我们得到 LLM 的表达式:

\[\mathbf{x} = \sum_{i=1}^{p} \alpha_i \mathbf{s}_i + \mathbf{n} \]

其中:

  • \(\mathbf{x}\) 表示像素光谱(观测到的混合光谱);
  • \(\mathbf{s}_i\) 表示第 \(i\) 个端元光谱;
  • \(\alpha_i\) 表示第 \(i\) 个端元在该像素中的丰度;
  • \(\mathbf{n}\) 表示设备噪声或其他未建模因素。

你会发现,这个公式和 MF 中对像素的建模公式十分相似。
实际上,MF 中的系数 \(\alpha\) 其实就是 LMM 的一个特殊情形。

我们继续展开,解释其具体语义:

4. 从 LLM 到 MF

再回顾一下基本知识,在高光谱目标检测中,我们通常只关心:某一种特定目标是否存在。

换成 LLM 的话说就是:我只关心某种特定的端元,其他都是背景。

于是我们把所有其他材料通通合并为背景,就像这样:

\[\mathbf{x} = \alpha_t \mathbf{s}t + \sum{i\ne t} \alpha_i \mathbf{s}_i + \mathbf{n} \]

其中, \(\mathbf{s}_t\) 就是目标光谱,\(\alpha_t\) 就是目标丰度,二者的组合就是我们的目标信号 ,而其他因素都是非目标信号

我们把所有非目标信号合并

\[\mathbf{b} = \sum_{i\ne t} \alpha_t\mathbf{s}_i + \mathbf{n} \]

模型就变成:

\[\mathbf{x} = \alpha_t \mathbf{s}_t + \mathbf{b} \]

去掉角标,这就是 MF 的模型

因此:\(\alpha\) 本质上就是目标光谱在该像素中的丰度。

现在,再回到最初的问题:为什么 \(\alpha\) 在 MF 中的存在感不高?

再看一遍公式:

\[\mathbf{x} = \alpha \mathbf{s} + \mathbf{b} \]

以最直观的数学逻辑来看,在这个式子里,我们已知观测光谱 \(\mathbf{x}\) 和参考光谱 \(\mathbf{s}\) ,希望求解背景干扰 \(\mathbf{b}\) 来进行后续操作。

此时,最符号直觉的想法应该就是对观测光谱 \(\mathbf{x}\) 进行解混 ,通过其他方法求解目标端元的丰度,在通过运算得到未知量 \(\mathbf{b}\) 。

但 MF 不同,它通过估计方法直接得到 \(\mathbf{b}\) 的统计特性,绕过了对 \(\mathbf{b}\) 本身的求解,自然也就绕过了与 \(\alpha\) 相关的解混逻辑。

当然,MF 之所以不显式求解 \(\alpha\),只是方法自身的特性 ,因为它关注的是"检测目标存在与否",而不是每个像素的精确丰度。在更广泛的高光研究中,解混仍然是非常重要的步骤,这也是后续的介绍内容。

相关推荐
一个努力编程人3 小时前
机器学习————GBDT算法
人工智能·算法·机器学习
Coding茶水间3 小时前
基于深度学习的茶叶病害检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
开发语言·人工智能·深度学习·yolo·机器学习
Project_Observer3 小时前
任务条件布局规则如何帮助自动管理任务?
大数据·数据结构·人工智能·深度学习·机器学习·编辑器
老刘说AI3 小时前
初识神经网络与机器学习
人工智能·深度学习·神经网络·机器学习·语言模型·gpt-3·集成学习
格林威3 小时前
Halcon vs OpenCV 保存图像速度对比测试
人工智能·深度学习·opencv·机器学习·计算机视觉·halcon·工业相机
Fleshy数模4 小时前
从基础到实战:词向量转换在评价文本分析中的应用
爬虫·python·机器学习
资深web全栈开发4 小时前
迁移学习:站在巨人的肩膀上
人工智能·机器学习·迁移学习
HyperAI超神经4 小时前
在线教程丨免费CPU资源快速部署,覆盖Qwen3.5/DeepSeek-R1/Gemma 3/Llama 3.2等热门开源模型
人工智能·深度学习·学习·机器学习·ai编程·llama·vllm
集芯微电科技有限公司4 小时前
700V/1.6A单通道GaN FET增强型驱动器具有零反向恢复损耗
人工智能·单片机·嵌入式硬件·深度学习·神经网络·机器学习·生成对抗网络