R code debug 和 study

Q1:CSV文件中第一列就是country,为什么读取后变为X.country


Answer:CSV文件的原始列名是" country"(前面有空格),R将其转换为X.country。

R数据框,第一个参数为行索引,第二个参数为列索引

r 复制代码
dataframe[nrow, ncol]
# 第一个参数为空表示选择所有行,只保留指定的列
heptathlon[, c("hurdles", "highjump", "shot")]
# 等价于:
heptathlon[1:nrow(heptathlon), c("hurdles", "highjump", "shot")]

主成分分析 Principal Components Analysis

prcomp和princomp都是R中进行主成分分析的函数,但它们有重要区别:

prcomp的参数

prcomp的返回值

round()函数:四舍五入

第一个参数x:要四舍五入的数值或矩阵

第二个参数digits:保留的小数位数(默认为0)

r 复制代码
round(x, digits = 0)

碎石图(Scree Plot)

作用:碎石图是主成分分析中用于确定保留多少个主成分的重要可视化工具。

1、确定主成分数量:特征值 > 1 的主成分通常保留

2、识别"肘部":特征值突然变缓的点是关键转折点

3、平衡信息保留与降维:避免保留过多或过少的主成分

4、可视化决策:直观看到各主成分的重要性

为什么叫碎石:

  • 图中特征值随着主成分编号增加而下降

  • 下降趋势像山坡上的碎石(scree)

  • "肘部"(elbow)位置对应特征值突然变缓的点

  • 这个点就像山坡脚,再往后的碎石(主成分)可以忽略

  • 在R中,保存路径根目录是当前工作目录。

r 复制代码
# 1. 查看当前工作目录
getwd()

# 2. 设置工作目录(推荐方法)
setwd("D:/R file/多元统计分析")
# 然后可以直接使用相对路径
ggsave("image/scree_plot.png", scree_plot)

# 3. 使用RStudio菜单设置
# Session -> Set Working Directory -> Choose Directory...
相关推荐
SiYuanFeng2 小时前
uv初步介绍及简单的使用方法例子
开发语言·python·uv
寻寻觅觅☆2 小时前
东华OJ-基础题-31-素数(C++)
开发语言·c++·算法
松小白song2 小时前
PID详解+Matlab实现
开发语言·数据结构·matlab
张二娃同学2 小时前
基于 Python 与 Tkinter 的猜数字游戏设计与实现:支持玩家猜数与 AI 反向推理
开发语言·git·python·游戏·开源
jwn9992 小时前
PHP vs 易语言:5大核心区别详解
开发语言·php
Mr_Xuhhh2 小时前
C++算法刷题:排序子序列、削减整数、最长上升子序列(二)题解
开发语言·c++·算法
迈巴赫车主3 小时前
蓝桥杯 19717 挖矿java
java·开发语言·数据结构·算法·职场和发展·蓝桥杯
Sag_ever3 小时前
Java String 类详解:字符串常用方法 + 不可变性 一网打尽
java·开发语言