论文学习（四）：The utility of Random Forests for wildfire severity mapping

文章目录

1.Introduction
2.Methods
- [2.1Study area](#2.1Study area)
- [2.2Fire severity data](#2.2Fire severity data)
- [2.3Remotely sensed indices](#2.3Remotely sensed indices)
- [2.4Modelling and analysis](#2.4Modelling and analysis)
- - [2.4.1Random forest](#2.4.1Random forest)
  - [2.4.2Comparison of classification approaches and assessment of index importance](#2.4.2Comparison of classification approaches and assessment of index importance)
  - [2.4.3Fire severity mapping](#2.4.3Fire severity mapping)
3.Results
4.Discussion

论文标题：The utility of Random Forests for wildfire severity mapping（随机森林在绘制野火严重程度图中的实用性）

论文链接：https://www.sciencedirect.com/science/article/abs/pii/S0034425718303328?via%3Dihub

论文主题：使用随机森林分类器以提高使用陆地卫星图像在异构景观中绘制基于卫星的野火严重程度地图的准确性，并使用bootstrap和交叉验证评估了基于dNBR的分类方法和包含多种光谱指数的随机森林模型，这两种方式对火灾严重程度分类的预测准确性。随机森林分类器有：

对未燃烧（UB）、冠部烧焦（CS）和冠部消耗（CC）严重程度类别的分类准确度大于95%。
对低严重程度类别（冠部未燃烧，CU；部分冠部烧焦，PCS）的分类准确性大于74%。

研究对象：2006年至2016年澳大利亚东南部发生的16起大型野火中收集了基于点的火灾严重程度培训数据

论文结论：随机森林分类方式在所有严重程度等级上都优于基于dNBR的火灾严重程度分类方式，将分类准确率提高了6%-21%。

1.Introduction

大规模火灾严重程度测绘主要使用卫星图像和航空摄影的数据实现，其主要依赖于研究区域火灾前后光谱指数的差异，以此来反映火灾造成的环境变化程度，如，最为常用的dNBR指数。但使用单一的光谱指数进行计算往往存在较大的局限性，很多情况下，其会因环境因素的不同，如，植被的种类的差异等，而变得并不准确。其次，低火灾严重程度等级、火灾严重程度影响的复合等级（如部分树冠烧焦）等也很难用单一的光谱指数进行区分。即使是火灾严重程度测绘中广泛使用的指标dNBR，在某些情况下也被证明是次优的。

本文采用机器学习的方法，结合对一系列环境条件敏感的多个光谱指数，完成对森林火灾严重等级的合理划分。随机森林分类器作为机器学习的一种算法，非常适合解决火灾测绘问题，其可以同时考虑多个环境变量，在复杂测量空间中有较强的处理噪声和异常值的能力，并且被发现比其他机器学习分类器更适合火灾严重程度测绘。

本文目的为：

使用从中等分辨率（30米）陆地卫星图像中计算出的指标来评估随机森林模型对火灾严重程度进行分类的性能。
在训练集、测试集中，将使用dNBR的单一指标分类器与随机森林分类器的性能进行比较；
评估不同指标在改进火灾严重程度分类中的相对重要性；
研究新火灾的额外采样工作，以及如何提高随机森林模型的准确性。

2.Methods

2.1Study area

本研究包括2006年至2016年间在澳大利亚维多利亚州发生的16起大型野火，范围从1800公顷到120000公顷不等，火灾发生在一系列植被群落中，包括石南地（即灌木为主的群落）、开阔的森林和林地、高大的森林和松林。草和莎草为主的群落、干旱和半干旱木本植被群落被排除在研究之外。

2.2Fire severity data

本研究中用于分类器训练和验证的火灾严重程度数据通过使用航拍照片解释和数字化得出。根据树冠的烧焦程度和林下植被层（有机物）的消耗情况，从航拍照片中确定了五个火灾严重程度等级:

严重等级	航拍照片中的外观	植被破环	采样点数
树冠消耗（CC）	超过10%的树冠叶子被烧毁，红外照片中呈现黑色，且有小片烧焦的树冠。	照片中呈现黑色，有小片烧焦的树冠	2836
树冠烧焦（CS）	超过90%的树冠叶子被烧焦，在红外照片中显示为棕色	下部和中部灌木被烧毁，高大的灌木和树冠几乎完全烧焦	2878
部分树冠烧焦（PCS）	树冠有未燃烧和烧焦的叶子（10-90%），在红外照片中呈现红色和棕色	低矮的灌木被烧毁，一些高大的灌木和树冠被烧焦	947
树冠未烧毁（CU）	超过90%的树冠叶子没有燃烧，但林下部分已经燃烧。在红外照片中，树冠是红色的，林下是黑色或棕色的	地表火灾，较高的灌木和树冠仍未燃烧	1428
未燃烧（UB）	超过90%的树冠和林下树叶未燃烧。红外照片中，树冠和林下为红色。	地表和植被基本上未受火灾影响	2766

2.3Remotely sensed indices

本研究采用了包括归一化燃烧比（NBR）、归一化植被指数（NDVI）、归一化水分指数（NDWI）、可见大气阻力指数（VARI）和烧伤面积指数（BAI）作为火灾严重程度的潜在预测因素，这些因素对一系列受火灾影响的生态系统特征很敏感，包括树叶健康和覆盖率（NBR、NDVI）、树叶含水量（NDWI、VARI）和木炭（BAI），并且通常用于火灾检测和严重程度制图。计算方式如下：

其中，NBR、NDVI、NDWI、VARI均计算量火灾前后的差值，而BAI仅使用火灾后图像的计算。

本研究使用谷歌地球引擎（GEE）作图像采集和处理，以及光谱指数的推导。这是一个将公共访问遥感和地理空间数据与高性能并行计算服务相结合的平台。本研究使用了美国地质调查局（USGS）获取的Landsat地表反射率产品，所有影像都经过了地理参照和地形校正（Level T1），达到了适合研究目的的水平。

2.4Modelling and analysis

2.4.1Random forest

2.4.2Comparison of classification approaches and assessment of index importance

本研究中设计了一个包含9个光谱指数的随机森林模型，包括NBR、NDVI、NVWI、VARI的变化值、火灾前的指数值以及BAI值，为避免较窄的Landsat8带宽对分类也有影响，将卫星标识符（Landsat8、Landsat5、Landsat7）也纳入数据集中。将随机森林中决策树的个数设为500，每个节点上使用的预测变量的数量是模型中使用的变量数量的平方根。bootstrap被用于获得随机森林分类器准确性的中值和方差估计值。

随机选择70%的数据子集，不进行替换，用于训练随机森林分类器。随机选择不同火灾严重程度的数据，以确保用于培训和验证的数据在每个严重程度等级中的比例相等。训练好的RF用于对数据集的剩余30%进行分类，以验证模型精度。随机重复该过程1000次，并记录验证数据集中正确分类的数据点的比例（即可知道模型在不同等级下的准确度）。使用小提琴图以图形方式展示了随机森林分类器的分类精度，小提琴图描绘了箱线图和数据的概率密度。

在传统的使用单一光谱指数的火灾严重程度分级中，一般使用指数的某一具体数值作为分级的阈值。在本实验中采用了两种方法实现分类过程：

中点阈值ΔNBR分类法：计算每个火灾严重程度等级的平均指数变化值（如， Δ N B R ΔNBR ΔNBR指数），并使用该严重程度的指数变化量中值作为分类阈值。
序数回归法：这些分类阈值（有序变量）之间从小到大有序排列，建立有序回归模型（一种用于预测一个有序因变量与一个或多个自变量之间关系的回归模型）。

使用bootstrap的方式评估每个光谱指数变化量的模型性能，并使用 Δ N B R ΔNBR ΔNBR指数时具有最高的分类准确率。我们使用了传统的中点阈值ΔNBR分类法作为基线，以比较随机森林模型分类的效果。中点阈值ΔNBR分类的整体分类准确度与序数回归方法相似（分别为78.9%和80.8%）。通过从自助法（bootstrapped）数据中提取95%置信区间（CI），对每个严重性类别的RF和ΔNBR分类的准确性差异进行了统计评估。确定不重叠的CI在统计上显著不同（P < 0.05）。

对随机森林分类器和ΔNBR方法进行留一火交叉验证，方法是从训练数据集中排除一次火灾，并使用该火灾的所有样本点进行验证。我们重复这个过程，确保每次火灾只用于一次验证（n = 16）。在每次验证的火灾中，只有当火灾严重性类别有超过20次观察时，才评估分类准确性，以确保获得可靠的准确性估计。使用小提琴图（violin plots）图形化显示了随机森林分类器和ΔNBR分类的准确性。小提琴图如下：

小提琴图描绘了随机森林分类器和ΔNBR分类法在验证数据集中的准确率，且，训练和验证过程重复了1000次。小提琴图中显示了数据的概率密度（阴影区域）、中位数（白色菱形）、四分位数间距（黑色菱形）以及1000次迭代的第一和第三四分位数±1.5×四分位数间间距（黑色垂直线）。不重叠的95%置信区间用星号表示。

评估了从验证火灾中添加样本点对响随机森林分类器准确性的影响，方法是逐步将验证火灾的数据（每个火灾严重性类别10、20、30、40和50个点）添加到训练数据集中，并重新验证随机森林分类器的预测准确性。仅使用每个严重性类别至少有75个数据点的四场野火进行验证，以便从验证数据集中移除每个严重性类别多达50个点。包含在训练数据中的样本是从验证火灾中随机抽取的，且不重复，这个过程只重复了200次，以减少处理时间。

使用完整的数据集来训练随机森林（RF）分类器，并提取了基尼不纯度准则，以识别不同指数对火灾严重性分类的相对影响。我们通过拟合五个模型来评估前五个指数（I1--I5）的影响，这些模型是通过基于基尼重要性逐步添加变量得出的（即I1, I1 + I2, I1 + I2 + I3, I1 + I2 + I3 + I4, I1 + I2 + I3 + I4 + I5）。我们使用了上述的自助法过程，其中70%和30%的数据用于模型训练和验证，来估计模型的准确性。

2.4.3Fire severity mapping

在随机森林中，决策树的数量设置为100，因为建模中表示，100棵树足以产生稳定的错误率。提供给每个节点的预测变量的数量等于模型中变量数量的平方根。最后，在GEE上使用随机森林分类器生成火灾严重程度图，并将GEE制作的地图与从数字化航空照片中获得的可用严重程度地图进行视觉比较。

3.Results

随机森林模型在自助法交叉验证中显示出91%的高度分类准确性（见2.4.2小提琴图），有：

未燃烧（UB）、树冠烧伤（CS）和树冠消耗（CC）火灾严重性类别：中位数分类准确性达到95%或更高。
树冠未燃烧（CU）和部分树冠烧伤（PCS）类别：准确性约为75%

与ΔNBR阈值分类相比，随机森林模型在所有火灾严重性类别中的分类准确性显著更高，并且在UB、CU、PCS和CS类别中相对于ΔNBR显示出良好的改进（10-20%的分类准确性提高））。并且，随机森林方法减少了所有相邻严重性类别之间的误分类，其中，UB和CU类别之间、CU和PCS类别之间以及PCS和CS类别之间的误分类显著减少。见下表：

分类矩阵显示了随机森林模型和ΔNBR阈值分类之间的分类准确率差异（%）。给出了1000次引导迭代的中值和95%置信区间下限（L）和上限（U）（括号内）。沿对角线以粗体突出显示的值表示验证数据正确分类的变化，其中正值表示随机森林模型有更高准确性。以正常字体表示的值显示了验证数据误分类的变化（大多为负值，反映了使用随机森林模型时误分类数降低）。斜体表示的值具有95%的置信区间，不与零重叠，表明发生了显著变化。空单元格的观测值太少（n<250次迭代），无法计算有意义的中位数和CI。

随机森林模型在留一火交叉验证（如下图所示）中的预测准确性中位数与自助法交叉验证（上一小提琴图）报告的值相似，这表明当模型应用于新的火灾时，随机森林分类器具有高预测准确性。唯一的例外是CU类别，在应用于新火灾时，其中位数准确性约为55%（如下图所示）。

小提琴图描绘了应用于新火灾时，随机森林模型和ΔNBR分类法的准确率，x轴上的数字是"遗漏一个"交叉验证中使用的火灾数量。其中，ns表示P>0.1，.表示P<0.01-0.05，*表示P<0.05-0.001，**表示P<0.001。

但当随机森林模型应用于新火灾时，任何火灾严重性类别的预测范围都增加了（即概率密度图的长度增加，在两个小提琴图中均可发现），这表明一些火灾内的严重性类别预测效果不佳。这在CU（树冠未燃烧）和PCS（部分树冠烧伤）火灾严重性类别中尤为明显（上图所示）。与ΔNBR分类相比，RF分类器在PCS、CS（树冠烧伤）和CC（树冠消耗）类别中的预测准确性中位数分别提高了5%至15%（上图所示）。两种方法在CU类别上的表现都不佳（上图所示）。从验证火灾中添加训练数据提高了RF分类器在CU类别中的分类准确性（下图所示），但对其他类别的影响较小。增加50个新的训练数据点使CU类别的中位数准确性提高了约20%（下图所示）。

向RF分类器添加新样本数据对冠部未燃烧（CU）严重程度等级预测准确性的影响。

随机森林分类器的基尼统计将ΔNBR确定为对分类精度影响最大的变量，ΔNDWI和ΔNDVI也具有很高的重要性（见下图）。用于推导指数的卫星平台对分类精度的影响很小（见下图），这表明带宽的微小差异并不重要：

随机森林模型变量重要性的变化与整个数据集相吻合，通过基尼系数的平均下降来衡量。值越大表示重要性越大。

仅使用ΔNBR的随机森林分类器与使用全套指标的随机森林分类器的预测准确性几乎没有差异（见下图）。仅使用ΔNBR时，CU和PCS类别的分类精度较差，加入额外的光谱指数差异变量后，分类精度提高了20%以上，其中ΔNDWI和ΔNDVI的影响尤为显著（见下图）。ΔNDWI的加入使UB和CS类的分类准确率提高了约10%（见下图）。仅使用ΔNBR的RF分类准确率（72%）低于使用ΔNBR阈值的分类准确率。

小提琴图描绘了随机森林分类器在严重程度等级内响应ΔFSI和SI的准确率（%）。在每个严重程度等级中，小提琴图从随机森林分类器开始排序，变量数量从最少（左）到最多（右）。训练数据由完整数据集的随机样本（70%）组成，并对剩余数据进行了验证。训练和验证过程重复了1000次。

4.Discussion

本研究中首次使用随机森林算法实现野火严重程度的测绘，与仅使用ΔNBR的分类相比，随机森林分类器总体分类准确率提高了约10%。可观察到所有火灾严重程度等级的分类准确性都有显著提高（~6%-21%），低至中等火灾严重程度类别（即UB、CU、PCS、CS）之间的错误分类大大减少。结果表明，随机森林分类器的优势在于能同时结合许多对一系列环境属性（即树叶覆盖、树叶湿度和木炭）敏感的光谱指数变化量（图5、6）。并且，将火灾前的光谱数据加入模型训练也能提高模型分类准确度。

建议以后再继续看。