R语言入门:“Hellinger“转化和“normalize“转化(弦转化)的公式表示与R代码实现

1、写在前面

vegan包中的decostand()函数为群落生态学研究提供了一些流行的(和有效的)标准化方法。有关decostand()函数标准化的一些标准化方法可以看我的另一篇笔记:R语言入门:vegan包使用decostand()函数标准化方法

由于在网络上没有找到关于这两个转化的公式表示,而官方给出的解释又较为复杂,因此写了这篇笔记,帮助理解,方便日后复习查阅。

进行样方标准化时,可采用:"Hellinger"转化和"normalize"转化(弦转化)。

2、Hellinger转化

2.1 Hellinger转化过程解释

函数将使用边际总数来对数据进行标准化。对于每个值将被除以该行或列的总和,以使得每个值在标准化后的行或列的总加和为1,在此之后对结果取平方根,即Hellinger转化。也可以理解为:"total"标准化后取平方根,即hellinger转化。

2.2 Hellinger转化的公示表示

Hellinger转化的对象是一系列的列向量或者行向量,总归来说是对几串数字的计算,假设这里处理的是一个m行n列的矩阵(m X n),其中,m为样本/观测/样方/重复,n为物种。需要对其进行样方标准化,即对行进行标准化,这里采用Hellinger转化(标准化)。

若以其中一行举例(x1,x2,x3,x4,...,xn),则对于每一个元素xi标准化过程可以表示为:

2.3 Hellinger转化的代码实现
R 复制代码
x.hel <- decostand(x, "hellinger", MARGIN, range.global, logbase = 2, na.rm=FALSE, ...)

注:若仅仅进行样方标准化,输入下面代码即可:

R 复制代码
x.hel <- decostand(x, "hellinger")

参数说明:

  • x: 群落数据,类似矩阵的对象,用于进行标准化处理。
  • method: 标准化方法。
  • MARGIN: 如果默认不可接受,则为边界。这里默认为1,即对行向量进行标准化。
  • range.global: 在 method = "range" 中找到范围的矩阵。这允许在数据的子集之间使用相同的范围。 MARGIN 的维度必须与 x 匹配。
  • logbase: 在 method = "log" 中使用的对数基数。
  • na.rm: 忽略行或列标准化中的缺失值。
  • zap: 使接近零的值成为精确的零,以避免负值和夸张的物种丰富度估计。

3、Normalize转化

3.1 Normalize转化过程解释

每行或每列的值都会被缩放,使得每行的平方和为1。这个转化也称为"弦转化" chord。

3.2 Normalize转化的公示表示

弦转化的对象是一系列的列向量或者行向量,总归来说是对几串数字的计算,假设这里处理的是一个m行n列的矩阵(m X n),其中,m为样本/观测/样方/重复,n为物种。需要对其进行样方标准化,即对行进行标准化,这里采用normalize转化(标准化)。

若以其中一行举例(x1,x2,x3,x4,...,xn),则对于每一个元素xi标准化过程可以表示为:

3.3 Normalize转化的代码实现
R 复制代码
x.norm <- decostand(x, "normalize", MARGIN, range.global, logbase = 2, na.rm=FALSE, ...)

注:若仅仅进行样方标准化,输入下面代码即可:

R 复制代码
x.norm <- decostand(x, "normalize")

参数说明(跟上面一样):

  • x: 群落数据,类似矩阵的对象,用于进行标准化处理。
  • method: 标准化方法。
  • MARGIN: 如果默认不可接受,则为边界。这里默认为1,即对行向量进行标准化。
  • range.global: 在 method = "range" 中找到范围的矩阵。这允许在数据的子集之间使用相同的范围。 MARGIN 的维度必须与 x 匹配。
  • logbase: 在 method = "log" 中使用的对数基数。
  • na.rm: 忽略行或列标准化中的缺失值。
  • zap: 使接近零的值成为精确的零,以避免负值和夸张的物种丰富度估计。

4、Hellinger转化和弦转化的关系

根据上面公式表示,不难理解,Hellinger转化等同于数据先平方根转化后再进行弦转化。​​​​​​​反过来说,弦转化是多度数据平方后的Hellinger转化。

参考:赖江山.《数量生态学------R语言的应用》. 北京:高等教育出版社

Package vegan version 2.6-4

相关推荐
豆浆whisky21 分钟前
Go并发模式选择指南:找到最适合你项目的并发方案|Go语言进阶(19)
开发语言·后端·golang
草莓熊Lotso23 分钟前
《算法闯关指南:动态规划算法--斐波拉契数列模型》--01.第N个泰波拉契数,02.三步问题
开发语言·c++·经验分享·笔记·其他·算法·动态规划
胖咕噜的稞达鸭1 小时前
自定义shell命令行解释器自制
java·开发语言
草莓熊Lotso1 小时前
Git 分支管理:从基础操作到协作流程(本地篇)
大数据·服务器·开发语言·c++·人工智能·git·sql
报错小能手1 小时前
C++异常处理 终极及总结
开发语言·c++
tobebetter95277 小时前
How to manage python versions on windows
开发语言·windows·python
FFF团团员9097 小时前
树莓派学习笔记3:LED和Button
笔记·学习
9***P3348 小时前
PHP代码覆盖率
开发语言·php·代码覆盖率
CoderYanger8 小时前
优选算法-栈:67.基本计算器Ⅱ
java·开发语言·算法·leetcode·职场和发展·1024程序员节
碧海潮生_CC8 小时前
【CUDA笔记】04 CUDA 归约, 原子操作,Warp 交换
笔记·cuda