在上一篇中,我们介绍了 MF。在其推导过程中,我们对像素进行了如下建模:
\[\mathbf{x} = \alpha \mathbf{s} + \mathbf{b} \]
当时,我们解释这种建模可以分离目标信号和背景信号,直观来看,这个公式的逻辑就是:
\[像素光谱=目标光谱+其他干扰 \]
但是,这里还有一个我们一直没有展开的符号,那就是:\(\alpha\)
在上一篇中,我们将其解释为目标在该像素中的强度 ,那这个好像没什么存在感的系数是怎么来的?为什么感觉好像有没有都一样?
显然,\(\alpha\) 并不是凭空出现的,它有着明确的物理和数学意义。
要解释 \(\alpha\),就要涉及到高光谱遥感中的一个非常重要的理论框架,那就是线性光谱混合模型(Linear Spectral Mixing Model, LMM)。
1. LLM 起源和地位
LLM 的起源可以追溯到高光谱遥感发展的早期阶段。1995 年,论文 Mapping Target Signatures via Partial Unmixing of AVIRIS Data 提出了 部分解混(Partial Unmixing) 的方法,引入了 端元(Endmember) 与 丰度(Abundance) 的概念,用于从混合像素中分离出目标光谱。这一方法奠定了现代高光谱影像分析中 解混(Spectral Unmixing) 的基础,并在目标检测、定量分析以及环境监测中得到广泛应用。
随后,2002 年,论文Spectral Unmixing 对光谱解混进行了系统总结,将 LMM 从早期实践经验上升为完整的理论框架,为现代高光谱分析提供了可解释、可量化且标准化的理论基础。
即使在现在,LMM 仍然是高光谱分析中不可替代的主流工具,即便面对复杂非线性场景,它也常作为基线方法使用,同时为稀疏解混、深度学习解混网络以及 MF/ACE 等现代方法提供理论支撑。
出现了很多没见过的词,下面,我们就来一一展开。
2. LLM 的核心思想
结合物理常识,先从我们的生活中来举个例子:
首先,光是会反射的,我们看到一朵红色的玫瑰,是因为玫瑰本身的材料主要反射红色光,这些反射光会进入我们的眼中,从而让我们看到玫瑰。
但是,我们看到玫瑰是红色的,不代表反射进我们眼里的光全来自玫瑰 。周围环境也会对我们看到的颜色产生影响:阳光的颜色、空气中悬浮的灰尘、旁边绿叶的反射光,都会混合进我们最终观察到的光线中。
总结一下:我们眼中的光,是多种材料反射光的混合。
我们的眼睛是这样,高光谱相机的镜头也是这样,可能某个像素看起来是植物,但其光谱特征其实是植物、土壤、水体的混合,只是植物所占比例更大而已。

这就是 LLM 的核心思想:
每个高光谱像素的光谱可以看作由若干"纯材料光谱"按一定比例线性叠加而成。
基于这一理念,我们就可以使用数学方法把"混合光谱"进行"拆分",这个过程就是上面提到的"解混 "。由此,便衍生出端元 和丰度两个概念:
2.1 端元(Endmember)
所谓端元 ,指的是某一种材料在理想情况下的纯光谱特征。换句话说,如果一个像素只包含单一材料,那么该像素的光谱就可以看作这一材料的端元光谱。
在遥感场景中,往往会出现很多材料,如植被、土壤、水体、混凝土、矿物等等,获取这些材料在各个波段上的反射率曲线,那么这些光谱就可以作为端元光谱。
2.2 丰度(Abundance)
丰度的概念也不难理解,如果说端元描述的是有哪些材料参与了混合 ,那么丰度描述的就是:
每种材料在该像素中所占的比例或贡献程度。
举个例子,假定某个像素的组成如下:
| 材料 | 丰度 |
|---|---|
| 植被 | 0.6 |
| 土壤 | 0.3 |
| 阴影 | 0.1 |
这表示该像素中: 60% 的光谱来自植被、30% 来自土壤、10% 来自阴影。
这里要说明一点:端元不仅限于物质材料,任何对像素光谱有系统贡献的因素(包括阴影、雪、湿度等)都可以作为端元。
在实际应用中,丰度通常满足两个基本约束条件:
- 非负约束:材料的比例不可能为负。
- 和为一约束:所有材料的贡献比例加起来等于 1,也就是一个像素的全部组成。
了解了端元和丰度两个基本概念后,我们便可以引出 LLM 的数学形式。
3. LLM 的表达式
知道了端元和丰度的定义后,现在,每个像素的光谱就可以表示为端元光谱的线性组合 。
由此,我们得到 LLM 的表达式:
\[\mathbf{x} = \sum_{i=1}^{p} \alpha_i \mathbf{s}_i + \mathbf{n} \]
其中:
- \(\mathbf{x}\) 表示像素光谱(观测到的混合光谱);
- \(\mathbf{s}_i\) 表示第 \(i\) 个端元光谱;
- \(\alpha_i\) 表示第 \(i\) 个端元在该像素中的丰度;
- \(\mathbf{n}\) 表示设备噪声或其他未建模因素。
你会发现,这个公式和 MF 中对像素的建模公式十分相似。
实际上,MF 中的系数 \(\alpha\) 其实就是 LMM 的一个特殊情形。
我们继续展开,解释其具体语义:
4. 从 LLM 到 MF
再回顾一下基本知识,在高光谱目标检测中,我们通常只关心:某一种特定目标是否存在。
换成 LLM 的话说就是:我只关心某种特定的端元,其他都是背景。
于是我们把所有其他材料通通合并为背景,就像这样:
\[\mathbf{x} = \alpha_t \mathbf{s}t + \sum{i\ne t} \alpha_i \mathbf{s}_i + \mathbf{n} \]
其中, \(\mathbf{s}_t\) 就是目标光谱,\(\alpha_t\) 就是目标丰度,二者的组合就是我们的目标信号 ,而其他因素都是非目标信号 。
我们把所有非目标信号合并:
\[\mathbf{b} = \sum_{i\ne t} \alpha_t\mathbf{s}_i + \mathbf{n} \]
模型就变成:
\[\mathbf{x} = \alpha_t \mathbf{s}_t + \mathbf{b} \]
去掉角标,这就是 MF 的模型 。
因此:\(\alpha\) 本质上就是目标光谱在该像素中的丰度。
现在,再回到最初的问题:为什么 \(\alpha\) 在 MF 中的存在感不高?
再看一遍公式:
\[\mathbf{x} = \alpha \mathbf{s} + \mathbf{b} \]
以最直观的数学逻辑来看,在这个式子里,我们已知观测光谱 \(\mathbf{x}\) 和参考光谱 \(\mathbf{s}\) ,希望求解背景干扰 \(\mathbf{b}\) 来进行后续操作。
此时,最符号直觉的想法应该就是对观测光谱 \(\mathbf{x}\) 进行解混 ,通过其他方法求解目标端元的丰度,在通过运算得到未知量 \(\mathbf{b}\) 。
但 MF 不同,它通过估计方法直接得到 \(\mathbf{b}\) 的统计特性,绕过了对 \(\mathbf{b}\) 本身的求解,自然也就绕过了与 \(\alpha\) 相关的解混逻辑。
当然,MF 之所以不显式求解 \(\alpha\),只是方法自身的特性 ,因为它关注的是"检测目标存在与否",而不是每个像素的精确丰度。在更广泛的高光研究中,解混仍然是非常重要的步骤,这也是后续的介绍内容。