🌱 一、什么是R语言?
- R 是一种免费开源 的编程语言和软件环境,主要用于统计计算 和图形绘制。
- 广泛应用于数据科学、生物信息学、金融分析、社会科学等领域。
- 拥有丰富的扩展包(CRAN 上超过 20,000 个包)。
🛠️ 二、安装与环境准备
-
下载 R
官网:https://cran.r-project.org/
根据你的操作系统(Windows / macOS / Linux)下载并安装。
-
推荐使用 RStudio(集成开发环境 IDE)
下载地址:https://posit.co/download/rstudio-desktop/
RStudio 让写代码、查看数据、画图更方便。
📚 三、零基础学习路径(建议顺序)
第1步:熟悉基本语法
- 变量赋值:
x <- 5 - 数据类型:数值(numeric)、字符(character)、逻辑(logical)、因子(factor)
- 数据结构:
- 向量
c(1,2,3) - 矩阵
matrix() - 数据框
data.frame()(最常用) - 列表
list()
- 向量
✅ 练习:创建一个包含姓名、年龄、性别的数据框。
df <- data.frame(
name = c("张三", "李四", "王五"),
age = c(25, 30, 28),
gender = c("男", "女", "男")
)
print(df)

第2步:基础操作
- 读取数据:
read.csv("file.csv") - 查看数据:
head(),str(),summary() - 子集选取:
df[df$age > 25, ] - 常用函数:
mean(),sd(),table(),plot()
第3步:数据可视化(基础)
使用内置绘图系统或 ggplot2 包(更强大美观):
# 安装并加载 ggplot2
install.packages("ggplot2")
library(ggplot2)
# 示例:散点图
ggplot(mtcars, aes(x = wt, y = mpg)) +
geom_point()
第4步:常用包学习
| 包名 | 用途 |
|---|---|
dplyr |
数据清洗与操作(筛选、分组、汇总) |
tidyr |
数据整形(长宽格式转换) |
ggplot2 |
高级可视化 |
readr |
快速读取 CSV 等文件 |
stringr |
字符串处理 |
第5步:实战项目
- 分析一份公开数据集(如 iris、mtcars 内置数据)
- 尝试做:描述性统计、相关性分析、简单线性回归
- 输出报告:使用 R Markdown(
.Rmd文件)生成 HTML/PDF 报告
📖 四、推荐学习资源(中文)
-
书籍:
- 《R语言实战》(Robert I. Kabacoff 著,中文版)
- 《统计学习导论:基于R应用》(ISLR 中文版)
-
在线教程:
- 菜鸟教程 - R语言
- R语言中文社区
- B站搜索 "R语言入门"(推荐"莫烦Python"的R系列)
-
交互式学习:
- DataCamp(英文,有免费部分):https://www.datacamp.com/
- swirl(在R中边学边练):
install.packages("swirl")
library(swirl)
swirl()