R语言Scale函数与normalize.quantiles()函数的异同

基础介绍

数据标准化与wilcox分析_wilcox检验的数据必须log2吗-CSDN博客

R语言中的Quantile normalisation 原理详解

R 中的分位数归一化 (davetang.org)

How to do quantile normalization correctly for gene expression data analyses | Scientific Reports (nature.com)

在统计学中,分位数归一化是一种使两个分布在统计属性上相同的技术。要对两个或多个分布进行分位数归一化,而不使用参考分布,请像以前一样排序,然后设置为分布的平均值(通常为算术平均值)。因此,在所有情况下,最高值都成为最高值的平均值,第二高值成为第二高值的平均值,依此类推。

复制代码
df <- data.frame(one=c(5,2,3,4),
                 two=c(4,1,4,2),
                 three=c(3,4,6,8)
                 )
rownames(df) <- toupper(letters[1:4])
df

#确定每列的排名,从低到高:
df_rank <- apply(df,2,rank,ties.method="min")
df_rank

#将原始矩阵从低到高排序:
df_sorted <- data.frame(apply(df, 2, sort))
df_sorted

#计算均值:
df_mean <- apply(df_sorted, 1, mean)
df_mean

#最后将均值代入我们的排名矩阵中。

index_to_mean <- function(my_index, my_mean){
  return(my_mean[my_index])
}
 
df_final <- apply(df_rank, 2, index_to_mean, my_mean=df_mean)
rownames(df_final) <- toupper(letters[1:4])
df_final

差异

Scale函数与normalize.quantiles()函数的异同:

  1. Scale函数:
  • 算法:Scale函数是R语言中用来对数据进行标准化处理的函数,其算法是先减去平均值,再除以标准差。
  • 作用:通过Scale函数,可以将数据缩放到具有相同的标准差,但不一定具有相同的均值。
  • 优点:标准化后的数据可以更好地适应一些机器学习算法,如支持向量机(SVM)和主成分分析(PCA)。
  • 示例代码:scale(data)
  1. normalize.quantiles()函数:
  • 算法:normalize.quantiles()函数是R语言中另一种数据标准化的方法,其算法是计算数据的分位数,然后将数据的均值减去分位数。
  • 作用:通过normalize.quantiles()函数,可以保留数据的分布特征,将均值归零。
  • 优点:保留了数据的原始分布信息,适用于一些需要保持数据分布的情况。
  • 示例代码:normalize.quantiles(data)

异同点总结:

  1. **相同点:**都是用来对数据进行标准化处理的方法。

  2. 不同点:

  • Scale函数是先减去平均值再除以标准差,而normalize.quantiles()函数是计算分位数后将均值减去分位数。

  • Scale函数会使数据具有相同的标准差,而normalize.quantiles()函数会保留数据的原始分布信息。

  • 适用场景不同:Scale函数适用于需要将数据缩放到相同范围的情况,而normalize.quantiles()函数适用于需要保留数据原始分布特征的情况。


    normalize.quantiles()还原

关于R语言的normalize.quantiles()函数的逆运算

在R语言中,normalize.quantiles()函数用于将数据进行分位数标准化,使得数据符合正态分布。但是,normalize.quantiles()函数是一个单向操作的函数,无法直接逆运算还原。

如果想要逆运算还原数据,可以尝试使用inverse.quantile()函数来逆向操作,实现将标准化后的数据还原为原始数据。下面是一个简单的示例代码:

```R # 假设data是经过normalize.quantiles()标准化后的数据 data_normalized <- normalize.quantiles(data) # 使用inverse.quantile()函数逆向操作还原数据 data_restored <- inverse.quantile(data_normalized) # 检查还原后的数据是否与原始数据一致 identical(data, data_restored) ```

需要注意的是,逆向操作可能会存在一定的误差,具体效果取决于数据的特性和标准化的方法。在实际应用中,建议在还原数据后进行一定的验证和检查。

相关推荐
z落落4 分钟前
C# 字段与属性(get/set访问器、三种属性写法、只读属性)+属性拦截例子(get动态计算 + set数据校验)
开发语言·c#
影寂ldy13 分钟前
C#栈和队列
开发语言·c#
SilentSamsara21 分钟前
SQLAlchemy 2.x:异步 ORM 与数据库迁移 Alembic 完整指南
开发语言·数据库·python·sql·青少年编程·oracle·fastapi
basketball61627 分钟前
C++ static_cast 完全解析
开发语言·c++
子安柠36 分钟前
Go语言并发编程:协程与管道详解
开发语言·后端·golang
程序大视界40 分钟前
【Python系列课程】Python面向对象(下):封装、继承与多态
开发语言·python
Lumbrologist42 分钟前
【C++】零基础入门 · 第 12 节:模板与 STL 入门
开发语言·c++
天月风沙1 小时前
基于机器视觉的实验室器件仓储系统设计——内蒙古自治区国家级大创工程存档
开发语言·python
24zhgjx-fuhao1 小时前
虚链路的配置
开发语言·网络·php
techdashen1 小时前
Rust 中的小字符串:smol_str 与 smartstring 的对决
开发语言·后端·rust