资料片:R语言中常见的英文术语及其含义

文章目录

基础术语

Data Structures (数据结构)

  • vector - 向量,相同类型元素的一维数组
  • matrix - 矩阵,二维数组
  • data.frame - 数据框,类似Excel表格
  • list - 列表,可包含不同类型元素
  • factor - 因子,用于分类变量
  • array - 数组,多维数据结构

Functions (函数相关)

  • function() - 函数定义
  • arguments - 参数
  • parameters - 参数
  • return value - 返回值
  • call - 函数调用

数据处理

Data Manipulation

  • subset - 子集
  • filter - 过滤
  • select - 选择列
  • mutate - 创建新变量
  • transform - 转换数据
  • merge / join - 合并数据
  • aggregate - 聚合
  • sort / order - 排序

Missing Values (缺失值)

  • NA - 缺失值 (Not Available)
  • NULL - 空值
  • NaN - 非数字 (Not a Number)
  • is.na() - 检查缺失值
  • complete.cases() - 完整观测

统计建模

Regression (回归)

  • lm() - 线性模型 (Linear Model)
  • glm() - 广义线性模型 (Generalized Linear Model)
  • coefficients - 系数
  • intercept - 截距项
  • slope - 斜率

Model Evaluation (模型评估)

  • residuals - 残差
  • fitted values - 拟合值
  • R-squared - R平方
  • p-value - P值
  • AIC / BIC - 信息准则

Statistical Tests (统计检验)

  • t-test - t检验
  • ANOVA - 方差分析
  • chi-square test - 卡方检验
  • correlation - 相关性
  • hypothesis testing - 假设检验

机器学习

Cross-Validation (交叉验证)

  • training set - 训练集
  • test set - 测试集
  • validation set - 验证集
  • k-fold cross-validation - k折交叉验证
  • LOOCV - 留一法交叉验证 (Leave-One-Out Cross Validation)

Model Types (模型类型)

  • supervised learning - 监督学习
  • unsupervised learning - 无监督学习
  • classification - 分类
  • regression - 回归
  • clustering - 聚类

数据可视化

Plotting (绘图)

  • scatter plot - 散点图
  • histogram - 直方图
  • boxplot - 箱线图
  • bar chart - 条形图
  • line plot - 折线图
  • density plot - 密度图

Plot Components (图形组件)

  • x-axis / y-axis - x轴/y轴
  • legend - 图例
  • title - 标题
  • labels - 标签
  • theme - 主题

编程概念

Control Structures (控制结构)

  • if else - 条件语句
  • for loop - for循环
  • while loop - while循环
  • break - 跳出循环
  • next - 跳过当前迭代

Error Handling (错误处理)

  • warning - 警告
  • error - 错误
  • tryCatch() - 错误捕获
  • debug - 调试

包管理

Package Management

  • install.packages() - 安装包
  • library() - 加载包
  • require() - 要求加载包
  • namespace - 命名空间
  • dependencies - 依赖关系

文件操作

File Operations

  • read.csv() - 读取CSV文件
  • write.csv() - 写入CSV文件
  • working directory - 工作目录
  • path - 路径
  • import / export - 导入/导出

常用缩写

Common Abbreviations

  • df - 自由度 (degrees of freedom) 或数据框
  • var - 方差 (variance)
  • sd - 标准差 (standard deviation)
  • se - 标准误 (standard error)
  • CI - 置信区间 (confidence interval)
  • MSE - 均方误差 (mean squared error)
  • RMSE - 均方根误差 (root mean squared error)

重要函数族

Function Families

  • apply() family - 应用函数族 (lapply, sapply, apply等)
  • plyr / dplyr - 数据处理包
  • ggplot2 - 图形语法包
  • stringr - 字符串处理包
  • lubridate - 日期时间处理包

注:这些术语是理解R代码和文档的基础,熟悉它们能大大提高使用R语言的效率。

相关推荐
独隅20 分钟前
在 Lua 中,你可以使用 `os.date()` 函数轻松地将时间戳转换为格式化的时间字符串
开发语言·lua
思麟呀1 小时前
Linux的基础IO流
linux·运维·服务器·开发语言·c++
星释1 小时前
Rust 练习册 :Pythagorean Triplet与数学算法
开发语言·算法·rust
星释1 小时前
Rust 练习册 :Nth Prime与素数算法
开发语言·算法·rust
lkbhua莱克瓦242 小时前
Java基础——集合进阶3
java·开发语言·笔记
多喝开水少熬夜2 小时前
Trie树相关算法题java实现
java·开发语言·算法
QT 小鲜肉2 小时前
【QT/C++】Qt定时器QTimer类的实现方法详解(超详细)
开发语言·数据库·c++·笔记·qt·学习
lsx2024063 小时前
MySQL WHERE 子句详解
开发语言
Tony Bai3 小时前
【Go模块构建与依赖管理】09 企业级实践:私有仓库与私有 Proxy
开发语言·后端·golang
Lucky小小吴3 小时前
开源项目5——Go版本快速管理工具
开发语言·golang·开源