【R语言】 在读取 CSV 或 Excel 文件时的标准输出

R 在读取 CSV 或 Excel 文件时的标准输出

r 复制代码
Rows: 678 Columns: 46

意思是:你读取的这个数据表格总共有 678 行46 列


r 复制代码
── Column specification ─────────────────────────────────────────────────────────────────────────────────────────────────
Delimiter: ","

这表明文件使用的是 英文逗号(,)作为列的分隔符,这是标准的 CSV 格式。


r 复制代码
dbl (46): mean, std, ...

意思是:全部 46 列的数据类型都是 dbl(double 类型),也就是连续的数值型变量。

  • dbl 是 R 中 readr 包或 readxl 包识别到的数据类型,表示 numeric
  • 如果某些列是字符串,会显示为 chr
  • 如果是逻辑值(TRUE/FALSE),会显示为 lgl

r 复制代码
ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

这两行是提示你:

  • 如果你想查看更详细的列类型定义,可以运行:

    r 复制代码
    spec(df)
  • 如果你不想每次读取数据都看到这个提示,可以关闭它:

    r 复制代码
    read_csv("your_file.csv", show_col_types = FALSE)

实用建议

  1. 如果你只是想看数据的列名和结构:

    r 复制代码
    names(df)
    str(df)
    glimpse(df)  # tidyverse推荐方式
  2. 如果你想看每列是否有问题(如重复、空值、异常类型):

    r 复制代码
    colSums(is.na(df))       # 查看缺失值分布
    duplicated(names(df))    # 查看是否有重复列名
  3. 如果你想确认 Label 列是否重复:

    r 复制代码
    which(names(df) == "Label")  # 出现的位置

总结表格

输出部分 含义 建议操作
Rows: 678 数据有 678 行 说明样本数量
Columns: 46 数据有 46 列 说明变量数量
Delimiter: "," 使用逗号分隔 是标准的 CSV 格式
dbl (46) 所有变量都是数值型 无需修改,如果有误,可自定义类型
ℹ Use spec() 查看列类型详细信息 推荐调试或数据检查时使用