[缩略语大全]之[NVIDIA]篇

了解一个领域最快的方式就是先了解一些缩略语,今天我们一起学习一下当下比较火热的NVIDIA相关的缩略语

一、GPU 架构与微架构缩略语

架构世代(Architecture)

|-----------|--------------|----------------------|
| 缩略语 | 全称 | 说明 |
| Fermi | --- | 第一代通用 CUDA GPU |
| Kepler | --- | 引入动态并行 |
| Maxwell | --- | 能效大幅提升 |
| Pascal | --- | NVLink 初登场 |
| Volta | --- | Tensor Core 首次出现 |
| Turing | --- | Tensor + RT Core |
| Ampere | --- | A100,AI 计算主力 |
| Ada | Ada Lovelace | RTX 40 系列 |
| Hopper | --- | H100,Transformer 时代 |
| Blackwell | --- | B100/B200,新一代 AI GPU |


GPU 核心组成

|---------------|--------------------------|---------------|
| 缩略语 | 全称 | 人话解释 |
| SM | Streaming Multiprocessor | GPU 的"CPU 核心" |
| CUDA Core | --- | 标量 ALU |
| Warp | --- | 32 线程执行单元 |
| Lane | --- | Warp 中的单线程 |
| Scheduler | --- | Warp 调度器 |
| Register File | --- | SM 私有寄存器 |
| Shared Memory | --- | 程序员可控的高速缓存 |
| L1 Cache | --- | 每 SM 缓存 |
| L2 Cache | --- | 全 GPU 共享 |


二、Tensor / AI 相关缩略语(重中之重)

Tensor Core & AI 精度

|----------|----------------------------|--------------------|
| 缩略语 | 全称 | 说明 |
| TC | Tensor Core | 矩阵乘加硬件 |
| MMA | Matrix Multiply Accumulate | Tensor Core 指令 |
| TF32 | Tensor Float 32 | NVIDIA 特有格式 |
| FP16 | Half Precision | AI 主流 |
| BF16 | Brain Float 16 | 更稳定训练 |
| FP8 | Float 8 | Hopper / Blackwell |
| INT8 | --- | 推理 |
| INT4 | --- | 超低精度推理 |
| Sparsity | --- | 稀疏加速 |


AI 加速相关

|----------|----------------------------|--------------|
| 缩略语 | 全称 | 说明 |
| cuDNN | CUDA Deep Neural Network | 神经网络库 |
| cuBLAS | CUDA Basic Linear Algebra | 矩阵运算 |
| TensorRT | --- | 推理加速 |
| Triton | --- | NVIDIA 推理服务器 |
| NCCL | NVIDIA Collective Comm Lib | 多卡通信 |
| NVSHMEM | --- | GPU 共享内存 |
| MAGMA | --- | 稀疏线性代数 |


三、CUDA 编程模型缩略语

CUDA 执行模型

|--------|-----------------------------|-------------|
| 缩略语 | 全称 | 说明 |
| CUDA | Compute Unified Device Arch | 编程模型 |
| Host | --- | CPU |
| Device | --- | GPU |
| Kernel | --- | GPU 函数 |
| Grid | --- | Kernel 启动范围 |
| Block | --- | 线程块 |
| Thread | --- | GPU 线程 |
| Warp | --- | 32 线程 SIMD |


CUDA 内存模型

|---------------|------------------------|-------------|
| 缩略语 | 全称 | 说明 |
| HBM | High Bandwidth Memory | GPU 显存 |
| UVM | Unified Virtual Memory | 统一虚拟内存 |
| Pinned Memory | --- | 锁页内存 |
| Pageable | --- | 普通内存 |
| Zero-copy | --- | CPU/GPU 共享 |
| BAR | Base Address Register | PCIe 映射 基地址 |


四、NVIDIA 互联与总线缩略语

|----------|-------------------------------------------|------------|
| 缩略语 | 全称 | 说明 |
| NVLink | --- | GPU 高速互联 |
| NVSwitch | --- | GPU 交换芯片 |
| NVL | NVLink Lane | NVLink 通道 |
| NVL72 | --- | 72 GPU 全互联 |
| SXM | --- | 高功耗封装 |
| PCIe | Peripheral Component Interconnect Express | 外围组件互联 |


GPU 集群 & 多卡

|-----------|-------------------|------|
| 缩略语 | 全称 | 说明 |
| DP | Data Parallel | 数据并行 |
| MP | Model Parallel | 模型并行 |
| PP | Pipeline Parallel | 流水并行 |
| TP | Tensor Parallel | 张量并行 |
| AllReduce | --- | 梯度同步 |


五、数据中心 & DPU

BlueField / DPU

|-----------|----------------------|------------|
| 缩略语 | 全称 | 说明 |
| DPU | Data Processing Unit | 数据处理器 |
| BlueField | --- | NVIDIA DPU |
| DOCA | --- | DPU SDK |
| Arm | --- | DPU CPU |
| Offload | --- | 卸载 CPU 工作 |


六、软件栈 & 驱动相关

|--------------|---------------------------|----------|
| 缩略语 | 全称 | 说明 |
| CUDA Driver | --- | 内核态驱动 |
| CUDA Runtime | --- | 用户态 API |
| PTX | Parallel Thread Execution | 中间 IR |
| SASS | --- | GPU 汇编 |
| JIT | Just-In-Time | 运行期编译 |
| NVCC | NVIDIA CUDA Compiler | CUDA 编译器 |
| Nsight | --- | 性能分析工具 |


七、图形 & 光追(RTX 体系)

|---------|------------------------------|--------|
| 缩略语 | 全称 | 说明 |
| RTX | Ray Tracing Texel | 光追品牌 |
| RT Core | --- | 光追硬件 |
| BVH | Bounding Volume Hierarchy | 光追加速结构 |
| DLSS | Deep Learning Super Sampling | AI 超分 |
| OptiX | --- | 光追 SDK |


八、NVIDIA 芯片/封装/工艺相关

|------------|----------------------------|-----------|
| 缩略语 | 全称 | 说明 |
| CoWoS | Chip on Wafer on Substrate | 台积电封装 |
| HBM3 | --- | 高带宽显存 |
| HBM3e | --- | H100/B200 |
| Chiplet | --- | 小芯片 |
| Interposer | --- | 硅中介层 |
| TSMC | --- | 台积电 |

相关推荐
熊猫钓鱼>_>11 小时前
AI语料投毒与信息证伪:当生成式引擎成为攻击向量
人工智能·ai·agent·geo·skills·agent skills·openclaw
wang_yb11 小时前
当AI学会编程,我们还能做什么
ai·databook
智算菩萨11 小时前
AGI的定义:基于CHC认知理论的量化评估框架深度解析
论文阅读·人工智能·深度学习·ai·agi
mirson.ho12 小时前
给 Claude Code 装上“长期记忆“:本地部署双重记忆引擎实战
ai·ai编程
智算菩萨12 小时前
基于多模态基础模型迈向通用人工智能:BriVL模型深度解析
论文阅读·人工智能·ai·语言模型·agi
CoderJia程序员甲13 小时前
GitHub 热榜项目 - 日榜(2026-03-19)
人工智能·ai·大模型·github·ai教程
腾视科技TENSORTEC13 小时前
算力驱动智慧零售|腾视科技AI边缘算力盒子 —— 无人商超全场景解决方案重磅发布
人工智能·ai·零售·ainas·无人商超·ai边缘算力盒子·aibox
后端AI实验室14 小时前
我让AI模拟面试官考了我一个小时,然后我沉默了
java·ai
南宫乘风14 小时前
Qwen2.5-7B 指令(LoRA)微调完整实战指南
ai·语言模型·训练