R语言入门:“Hellinger“转化和“normalize“转化(弦转化)的公式表示与R代码实现

1、写在前面

vegan包中的decostand()函数为群落生态学研究提供了一些流行的(和有效的)标准化方法。有关decostand()函数标准化的一些标准化方法可以看我的另一篇笔记:R语言入门:vegan包使用decostand()函数标准化方法

由于在网络上没有找到关于这两个转化的公式表示,而官方给出的解释又较为复杂,因此写了这篇笔记,帮助理解,方便日后复习查阅。

进行样方标准化时,可采用:"Hellinger"转化和"normalize"转化(弦转化)。

2、Hellinger转化

2.1 Hellinger转化过程解释

函数将使用边际总数来对数据进行标准化。对于每个值将被除以该行或列的总和,以使得每个值在标准化后的行或列的总加和为1,在此之后对结果取平方根,即Hellinger转化。也可以理解为:"total"标准化后取平方根,即hellinger转化。

2.2 Hellinger转化的公示表示

Hellinger转化的对象是一系列的列向量或者行向量,总归来说是对几串数字的计算,假设这里处理的是一个m行n列的矩阵(m X n),其中,m为样本/观测/样方/重复,n为物种。需要对其进行样方标准化,即对行进行标准化,这里采用Hellinger转化(标准化)。

若以其中一行举例(x1,x2,x3,x4,...,xn),则对于每一个元素xi标准化过程可以表示为:

2.3 Hellinger转化的代码实现
R 复制代码
x.hel <- decostand(x, "hellinger", MARGIN, range.global, logbase = 2, na.rm=FALSE, ...)

注:若仅仅进行样方标准化,输入下面代码即可:

R 复制代码
x.hel <- decostand(x, "hellinger")

参数说明:

  • x: 群落数据,类似矩阵的对象,用于进行标准化处理。
  • method: 标准化方法。
  • MARGIN: 如果默认不可接受,则为边界。这里默认为1,即对行向量进行标准化。
  • range.global: 在 method = "range" 中找到范围的矩阵。这允许在数据的子集之间使用相同的范围。 MARGIN 的维度必须与 x 匹配。
  • logbase: 在 method = "log" 中使用的对数基数。
  • na.rm: 忽略行或列标准化中的缺失值。
  • zap: 使接近零的值成为精确的零,以避免负值和夸张的物种丰富度估计。

3、Normalize转化

3.1 Normalize转化过程解释

每行或每列的值都会被缩放,使得每行的平方和为1。这个转化也称为"弦转化" chord。

3.2 Normalize转化的公示表示

弦转化的对象是一系列的列向量或者行向量,总归来说是对几串数字的计算,假设这里处理的是一个m行n列的矩阵(m X n),其中,m为样本/观测/样方/重复,n为物种。需要对其进行样方标准化,即对行进行标准化,这里采用normalize转化(标准化)。

若以其中一行举例(x1,x2,x3,x4,...,xn),则对于每一个元素xi标准化过程可以表示为:

3.3 Normalize转化的代码实现
R 复制代码
x.norm <- decostand(x, "normalize", MARGIN, range.global, logbase = 2, na.rm=FALSE, ...)

注:若仅仅进行样方标准化,输入下面代码即可:

R 复制代码
x.norm <- decostand(x, "normalize")

参数说明(跟上面一样):

  • x: 群落数据,类似矩阵的对象,用于进行标准化处理。
  • method: 标准化方法。
  • MARGIN: 如果默认不可接受,则为边界。这里默认为1,即对行向量进行标准化。
  • range.global: 在 method = "range" 中找到范围的矩阵。这允许在数据的子集之间使用相同的范围。 MARGIN 的维度必须与 x 匹配。
  • logbase: 在 method = "log" 中使用的对数基数。
  • na.rm: 忽略行或列标准化中的缺失值。
  • zap: 使接近零的值成为精确的零,以避免负值和夸张的物种丰富度估计。

4、Hellinger转化和弦转化的关系

根据上面公式表示,不难理解,Hellinger转化等同于数据先平方根转化后再进行弦转化。​​​​​​​反过来说,弦转化是多度数据平方后的Hellinger转化。

参考:赖江山.《数量生态学------R语言的应用》. 北京:高等教育出版社

Package vegan version 2.6-4

相关推荐
ShineWinsu9 小时前
对于C++:模版初阶的解析
开发语言·c++·面试·笔试·函数··模版
saoys9 小时前
Opencv 学习笔记:轮廓发现(提取 + 绘制全流程)
笔记·opencv·学习
Max_uuc9 小时前
【C++ 硬核】告别 Excel 生成数组:利用 constexpr 实现编译期计算查找表 (LUT)
开发语言·c++·excel
墨雨晨曦889 小时前
leedcode刷题总结
java·开发语言
嫂子开门我是_我哥9 小时前
第十六节:异常处理:让程序在报错中稳定运行
开发语言·python
a努力。9 小时前
中国邮政Java面试被问:MySQL的ICP(索引条件下推)优化原理
java·开发语言·数据仓库·面试·职场和发展·重构·maven
青槿吖9 小时前
【趣味图解】线程同步与通讯:从抢奶茶看透synchronized、ReentrantLock和wait/notify
java·开发语言·jvm·算法
2401_838472519 小时前
C++20概念(Concepts)入门指南
开发语言·c++·算法
yong99909 小时前
基于MATLAB的GFSK调制解调实现
开发语言·matlab
郝学胜-神的一滴10 小时前
Python中的with语句与try语句:资源管理的两种哲学
linux·服务器·开发语言·python·程序人生·算法