R语言 基础笔记

起因:

今天不知道要写什么。 把之前的笔记复制一下。

代码开头,导入:

c 复制代码
# 清除系统变量
rm(list = ls())

# 隐藏警告信息: 
options(warn = -1)

# 把当前目录,设置为工作目录。
library(rstudioapi)
current_folder_path <- dirname(rstudioapi::getActiveDocumentContext()$path)
setwd(current_folder_path)
getwd()

R语言 临时笔记

  1. 输入: ?trainControl 查看函数的文档
  2. 查看目标列的分布情况
    • table(wbcd$diagnosis)

检查缺失值: na

  • is.na(kk) # 检查是否存在 na
  • sum(is.na(kk)) # 计算 na 的个数
  • unname(df) # 去除 列标签,让结果更整洁一些。

文件路径

  1. setwd("some_path") 设置当前的工作文件夹。
  2. getwd() 获取当前的工作文件夹 (一般是项目的根文件夹)
    • 把数据文件 csv 放在这个文件夹里面
  3. R studio 设置 安装包的位置

安装包

  1. 安装一个包 install.packages("tidyverse")
  2. 导入一个包 library(tidyverse)
  3. 我当前使用的 R
    • 版本是 4.1.3, 查看版本 version
    • 安装路径是 C:\Program Files\R\R-4.1.3\etc
    • 可以修改里面的 Rprofile.site

Jupyter 运行 R, 只需要一句话。

!!以管理员身份运行!!

  1. conda install -c r r-base r-essentials

  2. 另一种尝试

    conda install -c r r-base=3.6.3

    conda install -c r r-essentials

    install.packages('IRkernel')

    IRkernel::installspec()

  3. 安装 R 这个才是正确的。

    conda install -c conda-forge r-base=4.1.3 r-essentials

------------------------- 笔记 -----------------------

frame 操作

  1. 新增一列
    df$year <- df[, "VCF0004"]
  2. 对 frame 的一列进行重命名,原始数据的第一列,重命名为 Year
    colnames(college_data)[1] = "Year"

frame 过滤筛选数据

  1. 类似 isin()
    year_df <- filter(df, year %in% Year )
  2. 多个条件
    filter(year_df, ideology >0.0 & ideology <10.0)
  3. 分组聚合,类似 groupby()
    df2 <- aggregate(df1KaTeX parse error: Expected 'EOF', got '#' at position 21: ...ogy_score, #̲ 聚合后要选取的目标 ...year), # 按照那一列来
    mean) # 操作函数
  4. 拼接2个frame
    rbind(A, B) 按照行拼接, r-bind , row--bind
    cbind(A, B) 按照列拼接 c-bind , column-bind
  5. 按照某一列进行排序 使用 order 函数
    df[order(df$Year, decreasing = FALSE),]
相关推荐
夜流冰9 分钟前
Motor - 电机扭矩和电机大小的关系
笔记
天“码”行空17 分钟前
简化Lambda——方法引用
java·开发语言
z203483152024 分钟前
C++对象布局
开发语言·c++
Beginner x_u35 分钟前
如何解释JavaScript 中 this 的值?
开发语言·前端·javascript·this 指针
AI视觉网奇39 分钟前
LiveTalking 部署笔记
笔记
java1234_小锋1 小时前
Java线程之间是如何通信的?
java·开发语言
张张努力变强1 小时前
C++ Date日期类的设计与实现全解析
java·开发语言·c++·算法
倘若猫爱上鱼1 小时前
关于系统能检测到固态可移动硬盘(或U盘),系统资源管理器却始终无法扫描到固态可移动硬盘(或U盘)的解决办法
笔记
求真求知的糖葫芦1 小时前
巴伦学习(一)一种新型补偿传输线巴伦论文学习笔记(自用)
笔记·学习·射频工程
feifeigo1232 小时前
基于EM算法的混合Copula MATLAB实现
开发语言·算法·matlab