资料片:R语言中常见的英文术语及其含义

文章目录

基础术语

Data Structures (数据结构)

  • vector - 向量,相同类型元素的一维数组
  • matrix - 矩阵,二维数组
  • data.frame - 数据框,类似Excel表格
  • list - 列表,可包含不同类型元素
  • factor - 因子,用于分类变量
  • array - 数组,多维数据结构

Functions (函数相关)

  • function() - 函数定义
  • arguments - 参数
  • parameters - 参数
  • return value - 返回值
  • call - 函数调用

数据处理

Data Manipulation

  • subset - 子集
  • filter - 过滤
  • select - 选择列
  • mutate - 创建新变量
  • transform - 转换数据
  • merge / join - 合并数据
  • aggregate - 聚合
  • sort / order - 排序

Missing Values (缺失值)

  • NA - 缺失值 (Not Available)
  • NULL - 空值
  • NaN - 非数字 (Not a Number)
  • is.na() - 检查缺失值
  • complete.cases() - 完整观测

统计建模

Regression (回归)

  • lm() - 线性模型 (Linear Model)
  • glm() - 广义线性模型 (Generalized Linear Model)
  • coefficients - 系数
  • intercept - 截距项
  • slope - 斜率

Model Evaluation (模型评估)

  • residuals - 残差
  • fitted values - 拟合值
  • R-squared - R平方
  • p-value - P值
  • AIC / BIC - 信息准则

Statistical Tests (统计检验)

  • t-test - t检验
  • ANOVA - 方差分析
  • chi-square test - 卡方检验
  • correlation - 相关性
  • hypothesis testing - 假设检验

机器学习

Cross-Validation (交叉验证)

  • training set - 训练集
  • test set - 测试集
  • validation set - 验证集
  • k-fold cross-validation - k折交叉验证
  • LOOCV - 留一法交叉验证 (Leave-One-Out Cross Validation)

Model Types (模型类型)

  • supervised learning - 监督学习
  • unsupervised learning - 无监督学习
  • classification - 分类
  • regression - 回归
  • clustering - 聚类

数据可视化

Plotting (绘图)

  • scatter plot - 散点图
  • histogram - 直方图
  • boxplot - 箱线图
  • bar chart - 条形图
  • line plot - 折线图
  • density plot - 密度图

Plot Components (图形组件)

  • x-axis / y-axis - x轴/y轴
  • legend - 图例
  • title - 标题
  • labels - 标签
  • theme - 主题

编程概念

Control Structures (控制结构)

  • if else - 条件语句
  • for loop - for循环
  • while loop - while循环
  • break - 跳出循环
  • next - 跳过当前迭代

Error Handling (错误处理)

  • warning - 警告
  • error - 错误
  • tryCatch() - 错误捕获
  • debug - 调试

包管理

Package Management

  • install.packages() - 安装包
  • library() - 加载包
  • require() - 要求加载包
  • namespace - 命名空间
  • dependencies - 依赖关系

文件操作

File Operations

  • read.csv() - 读取CSV文件
  • write.csv() - 写入CSV文件
  • working directory - 工作目录
  • path - 路径
  • import / export - 导入/导出

常用缩写

Common Abbreviations

  • df - 自由度 (degrees of freedom) 或数据框
  • var - 方差 (variance)
  • sd - 标准差 (standard deviation)
  • se - 标准误 (standard error)
  • CI - 置信区间 (confidence interval)
  • MSE - 均方误差 (mean squared error)
  • RMSE - 均方根误差 (root mean squared error)

重要函数族

Function Families

  • apply() family - 应用函数族 (lapply, sapply, apply等)
  • plyr / dplyr - 数据处理包
  • ggplot2 - 图形语法包
  • stringr - 字符串处理包
  • lubridate - 日期时间处理包

注:这些术语是理解R代码和文档的基础,熟悉它们能大大提高使用R语言的效率。

相关推荐
xxie1237944 小时前
return与print
开发语言·python
秋94 小时前
从 Python 后端工程师转型 AI Engineer(AI 工程化)的完整补课清单(2026实战版)
开发语言·人工智能·python
程序员二叉5 小时前
【Java】 异常高频面试题精讲 | 易错点+对比总结
java·开发语言·面试
慕木沐5 小时前
Google ADK Java 1.0版本 核心机制与实战 Demo
java·开发语言·python
Roann_seo%5 小时前
C++文件操作完全指南:从文本读写到二进制文件处理
开发语言·c++
huangdong_6 小时前
淘宝商品SKU图自动分类技术深度解析:从DOM解析到智能归档
开发语言·javascript·ecmascript
阿正的梦工坊6 小时前
【Rust】12-借用检查器与非词法生命周期
开发语言·后端·rust
qq_2518364577 小时前
基于java Web网络订餐系统设计与实现 源码文档
java·开发语言·前端
秋97 小时前
3年经验Python后端转AI Engineer:3个月实战转型计划(2026版)
开发语言·人工智能·python
凡人叶枫7 小时前
Effective C++ 条款17:以独立语句将 newed 对象置入智能指针
java·linux·开发语言·c++·算法