R 在读取 CSV 或 Excel 文件时的标准输出
r
Rows: 678 Columns: 46
意思是:你读取的这个数据表格总共有 678 行 ,46 列。
r
── Column specification ─────────────────────────────────────────────────────────────────────────────────────────────────
Delimiter: ","
这表明文件使用的是 英文逗号(,
)作为列的分隔符,这是标准的 CSV 格式。
r
dbl (46): mean, std, ...
意思是:全部 46 列的数据类型都是 dbl
(double 类型),也就是连续的数值型变量。
dbl
是 R 中readr
包或readxl
包识别到的数据类型,表示numeric
。- 如果某些列是字符串,会显示为
chr
。 - 如果是逻辑值(TRUE/FALSE),会显示为
lgl
。
r
ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
这两行是提示你:
-
如果你想查看更详细的列类型定义,可以运行:
rspec(df)
-
如果你不想每次读取数据都看到这个提示,可以关闭它:
rread_csv("your_file.csv", show_col_types = FALSE)
实用建议
-
如果你只是想看数据的列名和结构:
rnames(df) str(df) glimpse(df) # tidyverse推荐方式
-
如果你想看每列是否有问题(如重复、空值、异常类型):
rcolSums(is.na(df)) # 查看缺失值分布 duplicated(names(df)) # 查看是否有重复列名
-
如果你想确认 Label 列是否重复:
rwhich(names(df) == "Label") # 出现的位置
总结表格
输出部分 | 含义 | 建议操作 |
---|---|---|
Rows: 678 |
数据有 678 行 | 说明样本数量 |
Columns: 46 |
数据有 46 列 | 说明变量数量 |
Delimiter: "," |
使用逗号分隔 | 是标准的 CSV 格式 |
dbl (46) |
所有变量都是数值型 | 无需修改,如果有误,可自定义类型 |
ℹ Use spec() |
查看列类型详细信息 | 推荐调试或数据检查时使用 |