[缩略语大全]之[NVIDIA]篇

了解一个领域最快的方式就是先了解一些缩略语,今天我们一起学习一下当下比较火热的NVIDIA相关的缩略语

一、GPU 架构与微架构缩略语

架构世代(Architecture)

|-----------|--------------|----------------------|
| 缩略语 | 全称 | 说明 |
| Fermi | --- | 第一代通用 CUDA GPU |
| Kepler | --- | 引入动态并行 |
| Maxwell | --- | 能效大幅提升 |
| Pascal | --- | NVLink 初登场 |
| Volta | --- | Tensor Core 首次出现 |
| Turing | --- | Tensor + RT Core |
| Ampere | --- | A100,AI 计算主力 |
| Ada | Ada Lovelace | RTX 40 系列 |
| Hopper | --- | H100,Transformer 时代 |
| Blackwell | --- | B100/B200,新一代 AI GPU |


GPU 核心组成

|---------------|--------------------------|---------------|
| 缩略语 | 全称 | 人话解释 |
| SM | Streaming Multiprocessor | GPU 的"CPU 核心" |
| CUDA Core | --- | 标量 ALU |
| Warp | --- | 32 线程执行单元 |
| Lane | --- | Warp 中的单线程 |
| Scheduler | --- | Warp 调度器 |
| Register File | --- | SM 私有寄存器 |
| Shared Memory | --- | 程序员可控的高速缓存 |
| L1 Cache | --- | 每 SM 缓存 |
| L2 Cache | --- | 全 GPU 共享 |


二、Tensor / AI 相关缩略语(重中之重)

Tensor Core & AI 精度

|----------|----------------------------|--------------------|
| 缩略语 | 全称 | 说明 |
| TC | Tensor Core | 矩阵乘加硬件 |
| MMA | Matrix Multiply Accumulate | Tensor Core 指令 |
| TF32 | Tensor Float 32 | NVIDIA 特有格式 |
| FP16 | Half Precision | AI 主流 |
| BF16 | Brain Float 16 | 更稳定训练 |
| FP8 | Float 8 | Hopper / Blackwell |
| INT8 | --- | 推理 |
| INT4 | --- | 超低精度推理 |
| Sparsity | --- | 稀疏加速 |


AI 加速相关

|----------|----------------------------|--------------|
| 缩略语 | 全称 | 说明 |
| cuDNN | CUDA Deep Neural Network | 神经网络库 |
| cuBLAS | CUDA Basic Linear Algebra | 矩阵运算 |
| TensorRT | --- | 推理加速 |
| Triton | --- | NVIDIA 推理服务器 |
| NCCL | NVIDIA Collective Comm Lib | 多卡通信 |
| NVSHMEM | --- | GPU 共享内存 |
| MAGMA | --- | 稀疏线性代数 |


三、CUDA 编程模型缩略语

CUDA 执行模型

|--------|-----------------------------|-------------|
| 缩略语 | 全称 | 说明 |
| CUDA | Compute Unified Device Arch | 编程模型 |
| Host | --- | CPU |
| Device | --- | GPU |
| Kernel | --- | GPU 函数 |
| Grid | --- | Kernel 启动范围 |
| Block | --- | 线程块 |
| Thread | --- | GPU 线程 |
| Warp | --- | 32 线程 SIMD |


CUDA 内存模型

|---------------|------------------------|-------------|
| 缩略语 | 全称 | 说明 |
| HBM | High Bandwidth Memory | GPU 显存 |
| UVM | Unified Virtual Memory | 统一虚拟内存 |
| Pinned Memory | --- | 锁页内存 |
| Pageable | --- | 普通内存 |
| Zero-copy | --- | CPU/GPU 共享 |
| BAR | Base Address Register | PCIe 映射 基地址 |


四、NVIDIA 互联与总线缩略语

|----------|-------------------------------------------|------------|
| 缩略语 | 全称 | 说明 |
| NVLink | --- | GPU 高速互联 |
| NVSwitch | --- | GPU 交换芯片 |
| NVL | NVLink Lane | NVLink 通道 |
| NVL72 | --- | 72 GPU 全互联 |
| SXM | --- | 高功耗封装 |
| PCIe | Peripheral Component Interconnect Express | 外围组件互联 |


GPU 集群 & 多卡

|-----------|-------------------|------|
| 缩略语 | 全称 | 说明 |
| DP | Data Parallel | 数据并行 |
| MP | Model Parallel | 模型并行 |
| PP | Pipeline Parallel | 流水并行 |
| TP | Tensor Parallel | 张量并行 |
| AllReduce | --- | 梯度同步 |


五、数据中心 & DPU

BlueField / DPU

|-----------|----------------------|------------|
| 缩略语 | 全称 | 说明 |
| DPU | Data Processing Unit | 数据处理器 |
| BlueField | --- | NVIDIA DPU |
| DOCA | --- | DPU SDK |
| Arm | --- | DPU CPU |
| Offload | --- | 卸载 CPU 工作 |


六、软件栈 & 驱动相关

|--------------|---------------------------|----------|
| 缩略语 | 全称 | 说明 |
| CUDA Driver | --- | 内核态驱动 |
| CUDA Runtime | --- | 用户态 API |
| PTX | Parallel Thread Execution | 中间 IR |
| SASS | --- | GPU 汇编 |
| JIT | Just-In-Time | 运行期编译 |
| NVCC | NVIDIA CUDA Compiler | CUDA 编译器 |
| Nsight | --- | 性能分析工具 |


七、图形 & 光追(RTX 体系)

|---------|------------------------------|--------|
| 缩略语 | 全称 | 说明 |
| RTX | Ray Tracing Texel | 光追品牌 |
| RT Core | --- | 光追硬件 |
| BVH | Bounding Volume Hierarchy | 光追加速结构 |
| DLSS | Deep Learning Super Sampling | AI 超分 |
| OptiX | --- | 光追 SDK |


八、NVIDIA 芯片/封装/工艺相关

|------------|----------------------------|-----------|
| 缩略语 | 全称 | 说明 |
| CoWoS | Chip on Wafer on Substrate | 台积电封装 |
| HBM3 | --- | 高带宽显存 |
| HBM3e | --- | H100/B200 |
| Chiplet | --- | 小芯片 |
| Interposer | --- | 硅中介层 |
| TSMC | --- | 台积电 |

相关推荐
Swizard2 小时前
拒绝“狗熊掰棒子”!用 EWC (Elastic Weight Consolidation) 彻底终结 AI 的灾难性遗忘
python·算法·ai·训练
爱笑的眼睛115 小时前
超越AdamW:优化器算法的深度实现、演进与自定义框架设计
java·人工智能·python·ai
Alluxio6 小时前
Alluxio正式登陆Oracle云市场,为AI工作负载提供TB级吞吐量与亚毫秒级延迟
人工智能·分布式·机器学习·缓存·ai·oracle
zhz52146 小时前
代码之恋(第十五篇:分布式心跳与网络延迟)
网络·分布式·ai·重构·vue·结对编程
Elastic 中国社区官方博客7 小时前
Elasticsearch:构建一个 AI 驱动的电子邮件钓鱼检测
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
默 语8 小时前
IPIDEA 代理技术在海外品牌社媒数据采集中的实操落地(Instagram 营销分析案例版)
java·人工智能·ai·ai编程
badfl8 小时前
OpenAI官方发布gpt-image-1.5有哪些亮点?
人工智能·ai·ai作画
FIT2CLOUD飞致云8 小时前
新增合同模块与报价功能,集成嵌入“大单网”标讯平台,Cordys CRM发布v1.4.0版本
ai·开源·crm·销售管理·cordys crm·大单网
iFlow_AI9 小时前
知识驱动开发:用iFlow工作流构建本地知识库
前端·ai·rag·mcp·iflow·iflow cli·iflowcli