R数据科学 16.5.3练习题

(1) 编写代码以使用一种映射函数完成以下任务。

a. 计算 mtcars 数据集中每列的均值。

b. 确定 nycflights13::flights 数据集中每列的类型。

c. 计算 iris 数据集中每列唯一值的数量。

d. 分别使用 μ= -10、0、10 和 100 的正态分布生成 10 个随机数。

复制代码
library(purrr)
# 计算 mtcars 每列的均值
mean_mtcars <- map(mtcars, mean)
# 确定 flights 数据集中每列的类型
column_types <- map(flights, class)
# 计算 iris 数据集中每列的唯一值的数量
unique_count <- map(iris, ~ length(unique(.)))
# 使用不同的均值生成 10 个随机数
random_numbers <- map(c(-10, 0, 10, 100), ~ rnorm(10, mean = .))

(2) 如何建立一个向量来表明数据框中的每一列是否为一个因子?

复制代码
# 建立一个向量表明每列是否为因子
is_factor <- map_lgl(iris, is.factor)

(3) 如果在非列表向量上使用映射函数,那么会发生什么情况? map(1:5, runif) 的作用是什么?为什么?

输出将是一个列表,其中包含不同长度的随机数向量。

map(1:5, runif) 会为向量 1:5 中的每个元素执行 runif() 函数,并生成相应数量的随机数。

(4) map(-2:2, rnorm, n = 5) 的作用是什么?为什么? map_dbl(-2:2, rnorm, n = 5) 的作用又是什么?为什么?

复制代码
map(-2:2, rnorm, n = 5)

该语句对 -2:2 进行映射,并对每个值执行 rnorm(n = 5, mean = x),即生成均值为 -2、-1、0、1 和 2 的 5 个正态分布随机数。每次生成的结果是一个包含 5 个随机数的列表,每个元素对应不同的均值。

复制代码
map_dbl(-2:2, rnorm, n = 5)

map_dbl() 会尝试将结果强制为数值向量,但由于 rnorm() 返回的是一个向量,map_dbl() 无法处理,所以会抛出一个错误。map_dbl() 适用于返回单个数值的函数,而不是返回向量的函数。

(5) 重写 map(x, function(df) lm(mpg ~ wt, data = df)) 这段代码,去除匿名函数。

复制代码
# 定义一个具体的函数  
fit_model <- function(df) {  
  lm(mpg ~ wt, data = df)  
}  
  
# 使用 map 调用这个函数  
result <- map(x, fit_model)
相关推荐
Mr_Xuhhh1 分钟前
pytest -- 指定⽤例执⾏顺序
开发语言·python·pytest
F_D_Z7 分钟前
【解决办法】网络训练报错AttributeError: module ‘jax.core‘ has no attribute ‘Shape‘.
开发语言·python·jax
chenyuhao202412 分钟前
MySQL索引特性
开发语言·数据库·c++·后端·mysql
laocooon52385788630 分钟前
vue3 本文实现了一个Vue3折叠面板组件
开发语言·前端·javascript
zzlyx991 小时前
用C#采用Avalonia+Mapsui在离线地图上插入图片画信号扩散图
java·开发语言·c#
韩曙亮1 小时前
【人工智能】AI 人工智能 技术 学习路径分析 ① ( Python语言 -> 微积分 / 概率论 / 线性代数 -> 机器学习 )
人工智能·python·学习·数学·机器学习·ai·微积分
Yue丶越1 小时前
【C语言】自定义类型:结构体
c语言·开发语言
合作小小程序员小小店1 小时前
桌面开发,点餐管理系统开发,基于C#,winform,sql server数据库
开发语言·数据库·sql·microsoft·c#
笃行客从不躺平1 小时前
线程池监控是什么
java·开发语言
星轨初途1 小时前
C++的输入输出(上)(算法竞赛类)
开发语言·c++·经验分享·笔记·算法