[缩略语大全]之[NVIDIA]篇

了解一个领域最快的方式就是先了解一些缩略语,今天我们一起学习一下当下比较火热的NVIDIA相关的缩略语

一、GPU 架构与微架构缩略语

架构世代(Architecture)

|-----------|--------------|----------------------|
| 缩略语 | 全称 | 说明 |
| Fermi | --- | 第一代通用 CUDA GPU |
| Kepler | --- | 引入动态并行 |
| Maxwell | --- | 能效大幅提升 |
| Pascal | --- | NVLink 初登场 |
| Volta | --- | Tensor Core 首次出现 |
| Turing | --- | Tensor + RT Core |
| Ampere | --- | A100,AI 计算主力 |
| Ada | Ada Lovelace | RTX 40 系列 |
| Hopper | --- | H100,Transformer 时代 |
| Blackwell | --- | B100/B200,新一代 AI GPU |


GPU 核心组成

|---------------|--------------------------|---------------|
| 缩略语 | 全称 | 人话解释 |
| SM | Streaming Multiprocessor | GPU 的"CPU 核心" |
| CUDA Core | --- | 标量 ALU |
| Warp | --- | 32 线程执行单元 |
| Lane | --- | Warp 中的单线程 |
| Scheduler | --- | Warp 调度器 |
| Register File | --- | SM 私有寄存器 |
| Shared Memory | --- | 程序员可控的高速缓存 |
| L1 Cache | --- | 每 SM 缓存 |
| L2 Cache | --- | 全 GPU 共享 |


二、Tensor / AI 相关缩略语(重中之重)

Tensor Core & AI 精度

|----------|----------------------------|--------------------|
| 缩略语 | 全称 | 说明 |
| TC | Tensor Core | 矩阵乘加硬件 |
| MMA | Matrix Multiply Accumulate | Tensor Core 指令 |
| TF32 | Tensor Float 32 | NVIDIA 特有格式 |
| FP16 | Half Precision | AI 主流 |
| BF16 | Brain Float 16 | 更稳定训练 |
| FP8 | Float 8 | Hopper / Blackwell |
| INT8 | --- | 推理 |
| INT4 | --- | 超低精度推理 |
| Sparsity | --- | 稀疏加速 |


AI 加速相关

|----------|----------------------------|--------------|
| 缩略语 | 全称 | 说明 |
| cuDNN | CUDA Deep Neural Network | 神经网络库 |
| cuBLAS | CUDA Basic Linear Algebra | 矩阵运算 |
| TensorRT | --- | 推理加速 |
| Triton | --- | NVIDIA 推理服务器 |
| NCCL | NVIDIA Collective Comm Lib | 多卡通信 |
| NVSHMEM | --- | GPU 共享内存 |
| MAGMA | --- | 稀疏线性代数 |


三、CUDA 编程模型缩略语

CUDA 执行模型

|--------|-----------------------------|-------------|
| 缩略语 | 全称 | 说明 |
| CUDA | Compute Unified Device Arch | 编程模型 |
| Host | --- | CPU |
| Device | --- | GPU |
| Kernel | --- | GPU 函数 |
| Grid | --- | Kernel 启动范围 |
| Block | --- | 线程块 |
| Thread | --- | GPU 线程 |
| Warp | --- | 32 线程 SIMD |


CUDA 内存模型

|---------------|------------------------|-------------|
| 缩略语 | 全称 | 说明 |
| HBM | High Bandwidth Memory | GPU 显存 |
| UVM | Unified Virtual Memory | 统一虚拟内存 |
| Pinned Memory | --- | 锁页内存 |
| Pageable | --- | 普通内存 |
| Zero-copy | --- | CPU/GPU 共享 |
| BAR | Base Address Register | PCIe 映射 基地址 |


四、NVIDIA 互联与总线缩略语

|----------|-------------------------------------------|------------|
| 缩略语 | 全称 | 说明 |
| NVLink | --- | GPU 高速互联 |
| NVSwitch | --- | GPU 交换芯片 |
| NVL | NVLink Lane | NVLink 通道 |
| NVL72 | --- | 72 GPU 全互联 |
| SXM | --- | 高功耗封装 |
| PCIe | Peripheral Component Interconnect Express | 外围组件互联 |


GPU 集群 & 多卡

|-----------|-------------------|------|
| 缩略语 | 全称 | 说明 |
| DP | Data Parallel | 数据并行 |
| MP | Model Parallel | 模型并行 |
| PP | Pipeline Parallel | 流水并行 |
| TP | Tensor Parallel | 张量并行 |
| AllReduce | --- | 梯度同步 |


五、数据中心 & DPU

BlueField / DPU

|-----------|----------------------|------------|
| 缩略语 | 全称 | 说明 |
| DPU | Data Processing Unit | 数据处理器 |
| BlueField | --- | NVIDIA DPU |
| DOCA | --- | DPU SDK |
| Arm | --- | DPU CPU |
| Offload | --- | 卸载 CPU 工作 |


六、软件栈 & 驱动相关

|--------------|---------------------------|----------|
| 缩略语 | 全称 | 说明 |
| CUDA Driver | --- | 内核态驱动 |
| CUDA Runtime | --- | 用户态 API |
| PTX | Parallel Thread Execution | 中间 IR |
| SASS | --- | GPU 汇编 |
| JIT | Just-In-Time | 运行期编译 |
| NVCC | NVIDIA CUDA Compiler | CUDA 编译器 |
| Nsight | --- | 性能分析工具 |


七、图形 & 光追(RTX 体系)

|---------|------------------------------|--------|
| 缩略语 | 全称 | 说明 |
| RTX | Ray Tracing Texel | 光追品牌 |
| RT Core | --- | 光追硬件 |
| BVH | Bounding Volume Hierarchy | 光追加速结构 |
| DLSS | Deep Learning Super Sampling | AI 超分 |
| OptiX | --- | 光追 SDK |


八、NVIDIA 芯片/封装/工艺相关

|------------|----------------------------|-----------|
| 缩略语 | 全称 | 说明 |
| CoWoS | Chip on Wafer on Substrate | 台积电封装 |
| HBM3 | --- | 高带宽显存 |
| HBM3e | --- | H100/B200 |
| Chiplet | --- | 小芯片 |
| Interposer | --- | 硅中介层 |
| TSMC | --- | 台积电 |

相关推荐
JavaGuide1 天前
Claude Opus 4.6 真的用不起了!我换成了国产 M2.5,实测真香!!
java·spring·ai·claude code
Swizard1 天前
逐行解剖:扒开 Lovable Agent 源码,看顶级 AI 是如何“思考”与“动刀”的
ai·prompt
warm3snow1 天前
AI 核心技能系列:12 篇文章带你系统掌握大模型岗位必备技能
ai·transformer·agent·skill·mcp·fine-tunning
曲幽1 天前
FastAPI + Ollama 实战:搭一个能查天气的AI助手
python·ai·lora·torch·fastapi·web·model·ollama·weatherapi
满猪星1 天前
ai使用分享
ai
程序员鱼皮2 天前
我做了个 AI 绘图工具,不用写提示词,一键复刻爆款图片!
java·计算机·ai·程序员·互联网·网站
Python大数据分析@2 天前
seedance 2.0牛在哪里?
ai
码农葫芦侠2 天前
Vercel Labs Skills:AI 编程安装「技能Skills」的工具
人工智能·ai·ai编程
lin_FS2 天前
Weight Decay 参数含义及作用
ai