【R语言】字符类型转换

文章目录

当R读入数据框时,会先自动定义数据类型
根据需求对数据框中的某几列转换字符类型

有哪些数据类型

查看字符类型

c 复制代码
> class(data)
[1] "data.frame"
> class(data$HD)
[1] "character"

查看数据框中所有列:

c 复制代码
> str(data)
'data.frame':	127 obs. of  10 variables:
 $ HD: chr  "H" "H" "H" "H" ...
 $ pH: num  6.07 5.99 6.56 6.04 6.75 ...
 $ Ec: num  124 115 156 206 328 ...
 $ AK: num  237 210 257 296 409 ...
 $ AP: chr  "35.8" "18.8" "19.6" "38" ...
 $ TP: num  0.813 0.775 0.752 0.881 0.926 0.924 0.682 0.728 0.717 0.749 ...
 $ TN: num  1.58 1.6 1.57 1.63 1.7 ...
 $ AN: num  138 140 136 142 137 ...
 $ OC: num  17.5 18.3 17.3 18.3 17.2 ...
 $ OM: num  30.2 31.6 29.8 31.6 29.7 ...

字符串转换

单个字符串转换

c 复制代码
data$HD <- as.factor(data$HD)

多列字符串转换

使用 lapply 函数

可以使用 lapply 对除第一列外的所有列进行转换

c 复制代码
# 将除第一列以外的列转换为数值型
df[, -1] <- lapply(df[, -1], as.numeric)

str(df)  # 检查结果

使用 dplyr 包的 mutate_at 或 mutate(across(...))

dplyr 提供了简单的方法来指定要转换的列

使用 dplyr 包的 mutate_all 函数可以将整个数据框的列都转换为数值型,而 mutate_at 可以指定要转换的列。

c 复制代码
# 使用 mutate_all 将所有列转换为数值型:
df <- df %>% mutate_all(as.numeric)

# 使用 mutate_at 转换指定列:
df <- df %>% mutate_at(vars(col1, col3), as.numeric)
c 复制代码
# 使用 mutate_at 转换除第一列外的列
df <- df %>% mutate_at(vars(-col1), as.numeric)

# 使用 across (dplyr 1.0+ 版本)
df <- df %>% mutate(across(-col1, as.numeric))

str(df)  # 检查结果

使用 apply 函数

也可以使用 apply 将数据框的子集(即多列)转换为数值型。

c 复制代码
# 使用 apply 将除第一列以外的列转换为数值型
df[, -1] <- apply(df[, -1], 2, function(x) as.numeric(as.character(x)))

str(df)  # 检查结果

如果想转换多列,可以使用 apply 将数据框的子集(即多列)转换为数值型。

c 复制代码
df[c("col1", "col3")] <- apply(df[c("col1", "col3")], 2, as.numeric)
相关推荐
困死,根本不会7 分钟前
Qt Designer 基础操作学习笔记
开发语言·笔记·qt·学习·microsoft
李昊哲小课19 分钟前
Python 高级数据结构
开发语言·数据结构·python
MediaTea28 分钟前
Python:词频统计流程及综合示例
开发语言·python
wregjru30 分钟前
【读书笔记】Effective C++ 条款5~6:若不想使用编译器自动生成的函数,就该明确拒绝
java·开发语言
语戚34 分钟前
从 JVM 底层拆解:i++、++i、i+=1、i=i+1 的实现逻辑与坑点
java·开发语言·jvm·面试·自增·指令·虚拟机
喜欢喝果茶.36 分钟前
Qt MQTT部署
开发语言·qt
wefg141 分钟前
【Linux】线程同步与互斥 - 2(线程同步/条件变量/基于阻塞/环形队列的cp模型/线程池/线程安全/读写锁)
linux·开发语言
雨落在了我的手上1 小时前
C语言之数据结构初见篇(2):顺序表之通讯录的实现(续)
c语言·开发语言·数据结构
你这个代码我看不懂1 小时前
JVM栈、方法区和堆内存
java·开发语言·jvm
GIS阵地1 小时前
一场由Qt5 painter的drawRect引起的血雨腥风
开发语言·qt·gis·qgis