[缩略语大全]之[NVIDIA]篇

了解一个领域最快的方式就是先了解一些缩略语,今天我们一起学习一下当下比较火热的NVIDIA相关的缩略语

一、GPU 架构与微架构缩略语

架构世代(Architecture)

|-----------|--------------|----------------------|
| 缩略语 | 全称 | 说明 |
| Fermi | --- | 第一代通用 CUDA GPU |
| Kepler | --- | 引入动态并行 |
| Maxwell | --- | 能效大幅提升 |
| Pascal | --- | NVLink 初登场 |
| Volta | --- | Tensor Core 首次出现 |
| Turing | --- | Tensor + RT Core |
| Ampere | --- | A100,AI 计算主力 |
| Ada | Ada Lovelace | RTX 40 系列 |
| Hopper | --- | H100,Transformer 时代 |
| Blackwell | --- | B100/B200,新一代 AI GPU |


GPU 核心组成

|---------------|--------------------------|---------------|
| 缩略语 | 全称 | 人话解释 |
| SM | Streaming Multiprocessor | GPU 的"CPU 核心" |
| CUDA Core | --- | 标量 ALU |
| Warp | --- | 32 线程执行单元 |
| Lane | --- | Warp 中的单线程 |
| Scheduler | --- | Warp 调度器 |
| Register File | --- | SM 私有寄存器 |
| Shared Memory | --- | 程序员可控的高速缓存 |
| L1 Cache | --- | 每 SM 缓存 |
| L2 Cache | --- | 全 GPU 共享 |


二、Tensor / AI 相关缩略语(重中之重)

Tensor Core & AI 精度

|----------|----------------------------|--------------------|
| 缩略语 | 全称 | 说明 |
| TC | Tensor Core | 矩阵乘加硬件 |
| MMA | Matrix Multiply Accumulate | Tensor Core 指令 |
| TF32 | Tensor Float 32 | NVIDIA 特有格式 |
| FP16 | Half Precision | AI 主流 |
| BF16 | Brain Float 16 | 更稳定训练 |
| FP8 | Float 8 | Hopper / Blackwell |
| INT8 | --- | 推理 |
| INT4 | --- | 超低精度推理 |
| Sparsity | --- | 稀疏加速 |


AI 加速相关

|----------|----------------------------|--------------|
| 缩略语 | 全称 | 说明 |
| cuDNN | CUDA Deep Neural Network | 神经网络库 |
| cuBLAS | CUDA Basic Linear Algebra | 矩阵运算 |
| TensorRT | --- | 推理加速 |
| Triton | --- | NVIDIA 推理服务器 |
| NCCL | NVIDIA Collective Comm Lib | 多卡通信 |
| NVSHMEM | --- | GPU 共享内存 |
| MAGMA | --- | 稀疏线性代数 |


三、CUDA 编程模型缩略语

CUDA 执行模型

|--------|-----------------------------|-------------|
| 缩略语 | 全称 | 说明 |
| CUDA | Compute Unified Device Arch | 编程模型 |
| Host | --- | CPU |
| Device | --- | GPU |
| Kernel | --- | GPU 函数 |
| Grid | --- | Kernel 启动范围 |
| Block | --- | 线程块 |
| Thread | --- | GPU 线程 |
| Warp | --- | 32 线程 SIMD |


CUDA 内存模型

|---------------|------------------------|-------------|
| 缩略语 | 全称 | 说明 |
| HBM | High Bandwidth Memory | GPU 显存 |
| UVM | Unified Virtual Memory | 统一虚拟内存 |
| Pinned Memory | --- | 锁页内存 |
| Pageable | --- | 普通内存 |
| Zero-copy | --- | CPU/GPU 共享 |
| BAR | Base Address Register | PCIe 映射 基地址 |


四、NVIDIA 互联与总线缩略语

|----------|-------------------------------------------|------------|
| 缩略语 | 全称 | 说明 |
| NVLink | --- | GPU 高速互联 |
| NVSwitch | --- | GPU 交换芯片 |
| NVL | NVLink Lane | NVLink 通道 |
| NVL72 | --- | 72 GPU 全互联 |
| SXM | --- | 高功耗封装 |
| PCIe | Peripheral Component Interconnect Express | 外围组件互联 |


GPU 集群 & 多卡

|-----------|-------------------|------|
| 缩略语 | 全称 | 说明 |
| DP | Data Parallel | 数据并行 |
| MP | Model Parallel | 模型并行 |
| PP | Pipeline Parallel | 流水并行 |
| TP | Tensor Parallel | 张量并行 |
| AllReduce | --- | 梯度同步 |


五、数据中心 & DPU

BlueField / DPU

|-----------|----------------------|------------|
| 缩略语 | 全称 | 说明 |
| DPU | Data Processing Unit | 数据处理器 |
| BlueField | --- | NVIDIA DPU |
| DOCA | --- | DPU SDK |
| Arm | --- | DPU CPU |
| Offload | --- | 卸载 CPU 工作 |


六、软件栈 & 驱动相关

|--------------|---------------------------|----------|
| 缩略语 | 全称 | 说明 |
| CUDA Driver | --- | 内核态驱动 |
| CUDA Runtime | --- | 用户态 API |
| PTX | Parallel Thread Execution | 中间 IR |
| SASS | --- | GPU 汇编 |
| JIT | Just-In-Time | 运行期编译 |
| NVCC | NVIDIA CUDA Compiler | CUDA 编译器 |
| Nsight | --- | 性能分析工具 |


七、图形 & 光追(RTX 体系)

|---------|------------------------------|--------|
| 缩略语 | 全称 | 说明 |
| RTX | Ray Tracing Texel | 光追品牌 |
| RT Core | --- | 光追硬件 |
| BVH | Bounding Volume Hierarchy | 光追加速结构 |
| DLSS | Deep Learning Super Sampling | AI 超分 |
| OptiX | --- | 光追 SDK |


八、NVIDIA 芯片/封装/工艺相关

|------------|----------------------------|-----------|
| 缩略语 | 全称 | 说明 |
| CoWoS | Chip on Wafer on Substrate | 台积电封装 |
| HBM3 | --- | 高带宽显存 |
| HBM3e | --- | H100/B200 |
| Chiplet | --- | 小芯片 |
| Interposer | --- | 硅中介层 |
| TSMC | --- | 台积电 |

相关推荐
AI原生应用开发18 小时前
AIGC领域Bard在通信领域的内容创作
ai·aigc·bard
唐诺19 小时前
深入了解AI
人工智能·ai
ZEGO即构开发者19 小时前
如何用一句话让AI集成 ZEGO 产品
ai·实时互动·实时音视频·rtc
阿杰学AI19 小时前
AI核心知识76——大语言模型之RAG 2.0(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·rag·检索增强生成·rag2.0
GuoDongOrange19 小时前
智能体来了从 0 到 1:工作流在智能体系统中的真实作用
ai·智能体·从0到1·智能体来了·智能体来了从0到1
爱吃涮肉20 小时前
# 第二章:ClaudeCode核心功能(详细版)
ai
阿_焦20 小时前
docker部署dify踩坑笔记
docker·ai·dify
自可乐21 小时前
AutoGen(多智能体AI框架)全面学习教程
人工智能·python·学习·ai
asaotomo21 小时前
一款 AI 驱动的新一代安全运维代理 —— DeepSentry(深哨)
运维·人工智能·安全·ai·go
安全二次方security²1 天前
CUDA C++编程指南(7.25)——C++语言扩展之DPX
c++·人工智能·nvidia·cuda·dpx·cuda c++编程指南