R语言 基础笔记

起因:

今天不知道要写什么。 把之前的笔记复制一下。

代码开头,导入:

c 复制代码
# 清除系统变量
rm(list = ls())

# 隐藏警告信息: 
options(warn = -1)

# 把当前目录,设置为工作目录。
library(rstudioapi)
current_folder_path <- dirname(rstudioapi::getActiveDocumentContext()$path)
setwd(current_folder_path)
getwd()

R语言 临时笔记

  1. 输入: ?trainControl 查看函数的文档
  2. 查看目标列的分布情况
    • table(wbcd$diagnosis)

检查缺失值: na

  • is.na(kk) # 检查是否存在 na
  • sum(is.na(kk)) # 计算 na 的个数
  • unname(df) # 去除 列标签,让结果更整洁一些。

文件路径

  1. setwd("some_path") 设置当前的工作文件夹。
  2. getwd() 获取当前的工作文件夹 (一般是项目的根文件夹)
    • 把数据文件 csv 放在这个文件夹里面
  3. R studio 设置 安装包的位置

安装包

  1. 安装一个包 install.packages("tidyverse")
  2. 导入一个包 library(tidyverse)
  3. 我当前使用的 R
    • 版本是 4.1.3, 查看版本 version
    • 安装路径是 C:\Program Files\R\R-4.1.3\etc
    • 可以修改里面的 Rprofile.site

Jupyter 运行 R, 只需要一句话。

!!以管理员身份运行!!

  1. conda install -c r r-base r-essentials

  2. 另一种尝试

    conda install -c r r-base=3.6.3

    conda install -c r r-essentials

    install.packages('IRkernel')

    IRkernel::installspec()

  3. 安装 R 这个才是正确的。

    conda install -c conda-forge r-base=4.1.3 r-essentials

------------------------- 笔记 -----------------------

frame 操作

  1. 新增一列
    df$year <- df[, "VCF0004"]
  2. 对 frame 的一列进行重命名,原始数据的第一列,重命名为 Year
    colnames(college_data)[1] = "Year"

frame 过滤筛选数据

  1. 类似 isin()
    year_df <- filter(df, year %in% Year )
  2. 多个条件
    filter(year_df, ideology >0.0 & ideology <10.0)
  3. 分组聚合,类似 groupby()
    df2 <- aggregate(df1KaTeX parse error: Expected 'EOF', got '#' at position 21: ...ogy_score, #̲ 聚合后要选取的目标 ...year), # 按照那一列来
    mean) # 操作函数
  4. 拼接2个frame
    rbind(A, B) 按照行拼接, r-bind , row--bind
    cbind(A, B) 按照列拼接 c-bind , column-bind
  5. 按照某一列进行排序 使用 order 函数
    df[order(df$Year, decreasing = FALSE),]
相关推荐
喜欢吃燃面3 小时前
Linux:环境变量
linux·开发语言·学习
代码游侠3 小时前
ARM开发——阶段问题综述(二)
运维·arm开发·笔记·单片机·嵌入式硬件·学习
徐徐同学3 小时前
cpolar为IT-Tools 解锁公网访问,远程开发再也不卡壳
java·开发语言·分布式
LawrenceLan3 小时前
Flutter 零基础入门(二十六):StatefulWidget 与状态更新 setState
开发语言·前端·flutter·dart
m0_748229993 小时前
Laravel8.X核心功能全解析
开发语言·数据库·php
张祥6422889043 小时前
误差理论与测量平差基础笔记十
笔记·算法·机器学习
qq_192779874 小时前
C++模块化编程指南
开发语言·c++·算法
代码村新手4 小时前
C++-String
开发语言·c++
qq_401700414 小时前
Qt 中文乱码的根源:QString::fromLocal8Bit 和 fromUtf8 区别在哪?
开发语言·qt