R code debug 和 study

Q1:CSV文件中第一列就是country,为什么读取后变为X.country


Answer:CSV文件的原始列名是" country"(前面有空格),R将其转换为X.country。

R数据框,第一个参数为行索引,第二个参数为列索引

r 复制代码
dataframe[nrow, ncol]
# 第一个参数为空表示选择所有行,只保留指定的列
heptathlon[, c("hurdles", "highjump", "shot")]
# 等价于:
heptathlon[1:nrow(heptathlon), c("hurdles", "highjump", "shot")]

主成分分析 Principal Components Analysis

prcomp和princomp都是R中进行主成分分析的函数,但它们有重要区别:

prcomp的参数

prcomp的返回值

round()函数:四舍五入

第一个参数x:要四舍五入的数值或矩阵

第二个参数digits:保留的小数位数(默认为0)

r 复制代码
round(x, digits = 0)

碎石图(Scree Plot)

作用:碎石图是主成分分析中用于确定保留多少个主成分的重要可视化工具。

1、确定主成分数量:特征值 > 1 的主成分通常保留

2、识别"肘部":特征值突然变缓的点是关键转折点

3、平衡信息保留与降维:避免保留过多或过少的主成分

4、可视化决策:直观看到各主成分的重要性

为什么叫碎石:

  • 图中特征值随着主成分编号增加而下降

  • 下降趋势像山坡上的碎石(scree)

  • "肘部"(elbow)位置对应特征值突然变缓的点

  • 这个点就像山坡脚,再往后的碎石(主成分)可以忽略

  • 在R中,保存路径根目录是当前工作目录。

r 复制代码
# 1. 查看当前工作目录
getwd()

# 2. 设置工作目录(推荐方法)
setwd("D:/R file/多元统计分析")
# 然后可以直接使用相对路径
ggsave("image/scree_plot.png", scree_plot)

# 3. 使用RStudio菜单设置
# Session -> Set Working Directory -> Choose Directory...
相关推荐
石山代码2 小时前
ArrayList / HashMap / ConcurrentHashMap
java·开发语言
程序大视界2 小时前
【Python系列课程】Python正则表达式(下):环视、命名分组与日志实战
开发语言·python·正则表达式
Michelle80232 小时前
24大数据 饼图复习
r语言
枫叶v.3 小时前
Agent 分层存储架构设计:从记忆方法到中间件选型
开发语言·python
sleven fung4 小时前
MinerU与BabelDOC与KTransformers与OpenAI API库
开发语言·python·ai·langchain
萤萤七悬4 小时前
【Python笔记】AI帮实现CLI工具-使用argparse.ArgumentParser接收命令参数
开发语言·笔记·python
iCxhust4 小时前
C# 命令行指令 查看二进制文件
开发语言·单片机·嵌入式硬件·c#·proteus·微机原理·8088单板机
csdn_aspnet5 小时前
Java 霍尔分区算法(Hoare‘s Partition Algorithm)
java·开发语言·算法
诸葛务农5 小时前
道路行驶条件下电动汽车永磁电机的有效使用寿命及永磁体的失效和回收再利用(下)
java·开发语言·算法
oort1235 小时前
VLStream:全开源决策式AI视频平台,赋能企业构建自主可控、降本增效的智能视觉应用介绍
大数据·开发语言·人工智能·开源·音视频·数据库架构