R语言基础笔记

waterHBO2024-09-19 16:35

起因:

今天不知道要写什么。把之前的笔记复制一下。

代码开头，导入:

c 复制代码

# 清除系统变量
rm(list = ls())

# 隐藏警告信息: 
options(warn = -1)

# 把当前目录，设置为工作目录。
library(rstudioapi)
current_folder_path <- dirname(rstudioapi::getActiveDocumentContext()$path)
setwd(current_folder_path)
getwd()

R语言临时笔记

输入: ?trainControl 查看函数的文档
查看目标列的分布情况
- table(wbcd$diagnosis)

检查缺失值: na

is.na(kk) # 检查是否存在 na
sum(is.na(kk)) # 计算 na 的个数
unname(df) # 去除列标签，让结果更整洁一些。

文件路径

setwd("some_path") 设置当前的工作文件夹。
getwd() 获取当前的工作文件夹 (一般是项目的根文件夹)
- 把数据文件 csv 放在这个文件夹里面
R studio 设置安装包的位置
- https://blog.csdn.net/qq_45642410/article/details/116858793

安装包

安装一个包 install.packages("tidyverse")
导入一个包 library(tidyverse)
我当前使用的 R
- 版本是 4.1.3，查看版本 version
- 安装路径是 C:\Program Files\R\R-4.1.3\etc
- 可以修改里面的 Rprofile.site

Jupyter 运行 R, 只需要一句话。

！！以管理员身份运行！！

conda install -c r r-base r-essentials
另一种尝试

conda install -c r r-base=3.6.3

conda install -c r r-essentials

install.packages('IRkernel')

IRkernel::installspec()
安装 R 这个才是正确的。

conda install -c conda-forge r-base=4.1.3 r-essentials

------------------------- 笔记 -----------------------

frame 操作

新增一列
df$year <- df $, "VCF0004"$
对 frame 的一列进行重命名，原始数据的第一列，重命名为 Year
colnames(college_data) $1$ = "Year"

frame 过滤筛选数据

类似 isin()
year_df <- filter(df, year %in% Year )
多个条件
filter(year_df, ideology >0.0 & ideology <10.0)
分组聚合，类似 groupby()
df2 <- aggregate(df1KaTeX parse error: Expected 'EOF', got '#' at position 21: ...ogy_score, #̲ 聚合后要选取的目标 ...year), # 按照那一列来
mean) # 操作函数
拼接2个frame
rbind(A, B) 按照行拼接， r-bind , row--bind
cbind(A, B) 按照列拼接 c-bind , column-bind
按照某一列进行排序使用 order 函数
df $order(df$Year, decreasing = FALSE),$

R语言 基础笔记

起因:

代码开头，导入:

R语言 临时笔记

检查缺失值: na

文件路径

安装包

Jupyter 运行 R, 只需要一句话。

！！以管理员身份运行！！

------------------------- 笔记 -----------------------

frame 操作

frame 过滤筛选数据

R语言基础笔记

R语言临时笔记