【R语言】字符类型转换

文章目录

当R读入数据框时,会先自动定义数据类型
根据需求对数据框中的某几列转换字符类型

有哪些数据类型

查看字符类型

c 复制代码
> class(data)
[1] "data.frame"
> class(data$HD)
[1] "character"

查看数据框中所有列:

c 复制代码
> str(data)
'data.frame':	127 obs. of  10 variables:
 $ HD: chr  "H" "H" "H" "H" ...
 $ pH: num  6.07 5.99 6.56 6.04 6.75 ...
 $ Ec: num  124 115 156 206 328 ...
 $ AK: num  237 210 257 296 409 ...
 $ AP: chr  "35.8" "18.8" "19.6" "38" ...
 $ TP: num  0.813 0.775 0.752 0.881 0.926 0.924 0.682 0.728 0.717 0.749 ...
 $ TN: num  1.58 1.6 1.57 1.63 1.7 ...
 $ AN: num  138 140 136 142 137 ...
 $ OC: num  17.5 18.3 17.3 18.3 17.2 ...
 $ OM: num  30.2 31.6 29.8 31.6 29.7 ...

字符串转换

单个字符串转换

c 复制代码
data$HD <- as.factor(data$HD)

多列字符串转换

使用 lapply 函数

可以使用 lapply 对除第一列外的所有列进行转换

c 复制代码
# 将除第一列以外的列转换为数值型
df[, -1] <- lapply(df[, -1], as.numeric)

str(df)  # 检查结果

使用 dplyr 包的 mutate_at 或 mutate(across(...))

dplyr 提供了简单的方法来指定要转换的列

使用 dplyr 包的 mutate_all 函数可以将整个数据框的列都转换为数值型,而 mutate_at 可以指定要转换的列。

c 复制代码
# 使用 mutate_all 将所有列转换为数值型:
df <- df %>% mutate_all(as.numeric)

# 使用 mutate_at 转换指定列:
df <- df %>% mutate_at(vars(col1, col3), as.numeric)
c 复制代码
# 使用 mutate_at 转换除第一列外的列
df <- df %>% mutate_at(vars(-col1), as.numeric)

# 使用 across (dplyr 1.0+ 版本)
df <- df %>% mutate(across(-col1, as.numeric))

str(df)  # 检查结果

使用 apply 函数

也可以使用 apply 将数据框的子集(即多列)转换为数值型。

c 复制代码
# 使用 apply 将除第一列以外的列转换为数值型
df[, -1] <- apply(df[, -1], 2, function(x) as.numeric(as.character(x)))

str(df)  # 检查结果

如果想转换多列,可以使用 apply 将数据框的子集(即多列)转换为数值型。

c 复制代码
df[c("col1", "col3")] <- apply(df[c("col1", "col3")], 2, as.numeric)
相关推荐
-凌凌漆-34 分钟前
【Qt】QStringLiteral 介绍
开发语言·qt
程序员爱钓鱼34 分钟前
Go语言项目工程化 — 常见开发工具与 CI/CD 支持
开发语言·后端·golang·gin
军训猫猫头1 小时前
1.如何对多个控件进行高效的绑定 C#例子 WPF例子
开发语言·算法·c#·.net
真的想上岸啊1 小时前
学习C++、QT---18(C++ 记事本项目的stylesheet)
开发语言·c++·学习
明天好,会的1 小时前
跨平台ZeroMQ:在Rust中使用zmq库的完整指南
开发语言·后端·rust
丁劲犇2 小时前
用 Turbo Vision 2 为 Qt 6 控制台应用创建 TUI 字符 MainFrame
开发语言·c++·qt·tui·字符界面·curse
旷世奇才李先生2 小时前
Next.js 安装使用教程
开发语言·javascript·ecmascript
charlie1145141913 小时前
深入理解Qt的SetWindowsFlags函数
开发语言·c++·qt·原理分析
likeGhee4 小时前
python缓存装饰器实现方案
开发语言·python·缓存
whoarethenext4 小时前
使用 C++/Faiss 加速海量 MFCC 特征的相似性搜索
开发语言·c++·faiss