十一、apply家族(4)

tapply()函数

tapply()函数主要是用于对一个因子或因子列表,执行指定的函数调用,最后获得汇总信息。
tapply()函数的使用格式如下所示。
tapply(x, INDEX, FUN, ...)
x:要处理的对象。
INDEX:因子或分类的字符串向量或因子列表。
FUN:要使用的函数。
... :FUN函数所需要的额外参数。

R 复制代码
height = c(172, 175, 168, 173, 176)
gender = c('M','F', 'F', 'M', 'F')    #"F":女(female);"M":男(male)

tapply(height, gender, mean)          #求女性、男性身高的平均值
    F     M 
173.0 172.5

tapply(height, gender, max)          ##求女性、男性身高的最大值
  F   M 
176 173 

下面以R语言内置数据集鸢尾花iris为例。
鸢尾花的3种类型( 山鸢尾(setosa)、变色鸢尾(versicolor)和维吉尼亚鸢尾(virginica) )。

R 复制代码
head(iris)        #记录了花萼的长度、宽度;花瓣的长度、宽度;种类
  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa
4          4.6         3.1          1.5         0.2  setosa
5          5.0         3.6          1.4         0.2  setosa
6          5.4         3.9          1.7         0.4  setosa

查看iris数据集的元素类型。

R 复制代码
sapply(iris, class)
Sepal.Length  Sepal.Width Petal.Length  Petal.Width      Species 
   "numeric"    "numeric"    "numeric"    "numeric"     "factor"    #数值;因子

计算不同种类鸢尾花的花瓣长度、宽度平均值。

R 复制代码
tapply(iris$Petal.Length, iris$Species, mean)    #不同种类花瓣长度的平均值
setosa versicolor  virginica 
 1.462      4.260      5.552


tapply(iris$Petal.Width, iris$Species, mean)     #不同种类花瓣宽度的平均值
setosa versicolor  virginica 
 0.246      1.326      2.026 
相关推荐
GZ同学1 天前
单双变量Ripley’s K函数 R 语言实现
开发语言·r语言
popcorn_min2 天前
共享单车需求预测:时间特征工程 + 随机森林,R² 达到 0.931
随机森林·r语言·kotlin
m0_497048936 天前
.NET10+Avalonia跨平台截屏工具解析
r语言
dongf20197 天前
R语言朴素贝叶斯算法---iris数据集
开发语言·算法·数据分析·r语言
All_Will_Be_Fine噻8 天前
重建R环境
开发语言·r语言
梦想的初衷~8 天前
基于R语言APSIM模型高级应用及批量模拟
r语言·apsim·作物生长模型·农业模拟·气象数据处理·土壤水分平衡
dongf20198 天前
R 语言 逻辑斯蒂回归
开发语言·数据分析·回归·r语言
dongf201910 天前
R 语言 Apriori 关联规则算法
数据分析·r语言·关联规则
dongf201910 天前
R语言决策树剪枝----泰坦尼克数据集
决策树·r语言·剪枝
dongf201910 天前
R语言分类决策数算法----iris数据集
分类·数据分析·r语言