R语言入门:“Hellinger“转化和“normalize“转化(弦转化)的公式表示与R代码实现

1、写在前面

vegan包中的decostand()函数为群落生态学研究提供了一些流行的(和有效的)标准化方法。有关decostand()函数标准化的一些标准化方法可以看我的另一篇笔记:R语言入门:vegan包使用decostand()函数标准化方法

由于在网络上没有找到关于这两个转化的公式表示,而官方给出的解释又较为复杂,因此写了这篇笔记,帮助理解,方便日后复习查阅。

进行样方标准化时,可采用:"Hellinger"转化和"normalize"转化(弦转化)。

2、Hellinger转化

2.1 Hellinger转化过程解释

函数将使用边际总数来对数据进行标准化。对于每个值将被除以该行或列的总和,以使得每个值在标准化后的行或列的总加和为1,在此之后对结果取平方根,即Hellinger转化。也可以理解为:"total"标准化后取平方根,即hellinger转化。

2.2 Hellinger转化的公示表示

Hellinger转化的对象是一系列的列向量或者行向量,总归来说是对几串数字的计算,假设这里处理的是一个m行n列的矩阵(m X n),其中,m为样本/观测/样方/重复,n为物种。需要对其进行样方标准化,即对行进行标准化,这里采用Hellinger转化(标准化)。

若以其中一行举例(x1,x2,x3,x4,...,xn),则对于每一个元素xi标准化过程可以表示为:

2.3 Hellinger转化的代码实现
R 复制代码
x.hel <- decostand(x, "hellinger", MARGIN, range.global, logbase = 2, na.rm=FALSE, ...)

注:若仅仅进行样方标准化,输入下面代码即可:

R 复制代码
x.hel <- decostand(x, "hellinger")

参数说明:

  • x: 群落数据,类似矩阵的对象,用于进行标准化处理。
  • method: 标准化方法。
  • MARGIN: 如果默认不可接受,则为边界。这里默认为1,即对行向量进行标准化。
  • range.global: 在 method = "range" 中找到范围的矩阵。这允许在数据的子集之间使用相同的范围。 MARGIN 的维度必须与 x 匹配。
  • logbase: 在 method = "log" 中使用的对数基数。
  • na.rm: 忽略行或列标准化中的缺失值。
  • zap: 使接近零的值成为精确的零,以避免负值和夸张的物种丰富度估计。

3、Normalize转化

3.1 Normalize转化过程解释

每行或每列的值都会被缩放,使得每行的平方和为1。这个转化也称为"弦转化" chord。

3.2 Normalize转化的公示表示

弦转化的对象是一系列的列向量或者行向量,总归来说是对几串数字的计算,假设这里处理的是一个m行n列的矩阵(m X n),其中,m为样本/观测/样方/重复,n为物种。需要对其进行样方标准化,即对行进行标准化,这里采用normalize转化(标准化)。

若以其中一行举例(x1,x2,x3,x4,...,xn),则对于每一个元素xi标准化过程可以表示为:

3.3 Normalize转化的代码实现
R 复制代码
x.norm <- decostand(x, "normalize", MARGIN, range.global, logbase = 2, na.rm=FALSE, ...)

注:若仅仅进行样方标准化,输入下面代码即可:

R 复制代码
x.norm <- decostand(x, "normalize")

参数说明(跟上面一样):

  • x: 群落数据,类似矩阵的对象,用于进行标准化处理。
  • method: 标准化方法。
  • MARGIN: 如果默认不可接受,则为边界。这里默认为1,即对行向量进行标准化。
  • range.global: 在 method = "range" 中找到范围的矩阵。这允许在数据的子集之间使用相同的范围。 MARGIN 的维度必须与 x 匹配。
  • logbase: 在 method = "log" 中使用的对数基数。
  • na.rm: 忽略行或列标准化中的缺失值。
  • zap: 使接近零的值成为精确的零,以避免负值和夸张的物种丰富度估计。

4、Hellinger转化和弦转化的关系

根据上面公式表示,不难理解,Hellinger转化等同于数据先平方根转化后再进行弦转化。​​​​​​​反过来说,弦转化是多度数据平方后的Hellinger转化。

参考:赖江山.《数量生态学------R语言的应用》. 北京:高等教育出版社

Package vegan version 2.6-4

相关推荐
88号技师20 小时前
2026年2月一区SCI-交叉传播优化算法Propagation Alongside Crossover-附Matlab免费代码
开发语言·算法·数学建模·matlab·优化算法
二哈赛车手20 小时前
新人笔记---idea索引失效问题解决方案
java·笔记·spring·elasticsearch·intellij-idea
A.零点20 小时前
【2个月 C 语言从入门到精通:零基础系统教程】第十二讲:深入了解指针(五)
c语言·开发语言·网络·笔记·visual studio
飞天狗11120 小时前
零基础JavaWeb入门——第五课第一小节:九大内置对象 · 第1个:request(请求对象)
java·开发语言·前端·后端·servlet
z落落20 小时前
C#ToolStrip+StatusStrip 状态栏实时显示系统时间+NotifyIcon系统托盘
开发语言·c#
插件开发21 小时前
vs2015 cuda c++ 线程号的计算详解
开发语言·c++·算法
石山代码21 小时前
变量与解构
开发语言·前端·javascript
c++之路21 小时前
Bazel C++ 构建系列文档(五):多目标与多包项目
java·开发语言·c++
Hello:CodeWorld21 小时前
【C++ 避坑指南】告别缓冲区溢出!全面解析 std::snprintf 的安全美学与核心陷阱
开发语言·c++·安全
凡人叶枫21 小时前
Effective C++ 条款38:通过复合塑模出 has-a 或 \“根据某物实现出\
linux·开发语言·c++·windows