[缩略语大全]之[NVIDIA]篇

了解一个领域最快的方式就是先了解一些缩略语,今天我们一起学习一下当下比较火热的NVIDIA相关的缩略语

一、GPU 架构与微架构缩略语

架构世代(Architecture)

|-----------|--------------|----------------------|
| 缩略语 | 全称 | 说明 |
| Fermi | --- | 第一代通用 CUDA GPU |
| Kepler | --- | 引入动态并行 |
| Maxwell | --- | 能效大幅提升 |
| Pascal | --- | NVLink 初登场 |
| Volta | --- | Tensor Core 首次出现 |
| Turing | --- | Tensor + RT Core |
| Ampere | --- | A100,AI 计算主力 |
| Ada | Ada Lovelace | RTX 40 系列 |
| Hopper | --- | H100,Transformer 时代 |
| Blackwell | --- | B100/B200,新一代 AI GPU |


GPU 核心组成

|---------------|--------------------------|---------------|
| 缩略语 | 全称 | 人话解释 |
| SM | Streaming Multiprocessor | GPU 的"CPU 核心" |
| CUDA Core | --- | 标量 ALU |
| Warp | --- | 32 线程执行单元 |
| Lane | --- | Warp 中的单线程 |
| Scheduler | --- | Warp 调度器 |
| Register File | --- | SM 私有寄存器 |
| Shared Memory | --- | 程序员可控的高速缓存 |
| L1 Cache | --- | 每 SM 缓存 |
| L2 Cache | --- | 全 GPU 共享 |


二、Tensor / AI 相关缩略语(重中之重)

Tensor Core & AI 精度

|----------|----------------------------|--------------------|
| 缩略语 | 全称 | 说明 |
| TC | Tensor Core | 矩阵乘加硬件 |
| MMA | Matrix Multiply Accumulate | Tensor Core 指令 |
| TF32 | Tensor Float 32 | NVIDIA 特有格式 |
| FP16 | Half Precision | AI 主流 |
| BF16 | Brain Float 16 | 更稳定训练 |
| FP8 | Float 8 | Hopper / Blackwell |
| INT8 | --- | 推理 |
| INT4 | --- | 超低精度推理 |
| Sparsity | --- | 稀疏加速 |


AI 加速相关

|----------|----------------------------|--------------|
| 缩略语 | 全称 | 说明 |
| cuDNN | CUDA Deep Neural Network | 神经网络库 |
| cuBLAS | CUDA Basic Linear Algebra | 矩阵运算 |
| TensorRT | --- | 推理加速 |
| Triton | --- | NVIDIA 推理服务器 |
| NCCL | NVIDIA Collective Comm Lib | 多卡通信 |
| NVSHMEM | --- | GPU 共享内存 |
| MAGMA | --- | 稀疏线性代数 |


三、CUDA 编程模型缩略语

CUDA 执行模型

|--------|-----------------------------|-------------|
| 缩略语 | 全称 | 说明 |
| CUDA | Compute Unified Device Arch | 编程模型 |
| Host | --- | CPU |
| Device | --- | GPU |
| Kernel | --- | GPU 函数 |
| Grid | --- | Kernel 启动范围 |
| Block | --- | 线程块 |
| Thread | --- | GPU 线程 |
| Warp | --- | 32 线程 SIMD |


CUDA 内存模型

|---------------|------------------------|-------------|
| 缩略语 | 全称 | 说明 |
| HBM | High Bandwidth Memory | GPU 显存 |
| UVM | Unified Virtual Memory | 统一虚拟内存 |
| Pinned Memory | --- | 锁页内存 |
| Pageable | --- | 普通内存 |
| Zero-copy | --- | CPU/GPU 共享 |
| BAR | Base Address Register | PCIe 映射 基地址 |


四、NVIDIA 互联与总线缩略语

|----------|-------------------------------------------|------------|
| 缩略语 | 全称 | 说明 |
| NVLink | --- | GPU 高速互联 |
| NVSwitch | --- | GPU 交换芯片 |
| NVL | NVLink Lane | NVLink 通道 |
| NVL72 | --- | 72 GPU 全互联 |
| SXM | --- | 高功耗封装 |
| PCIe | Peripheral Component Interconnect Express | 外围组件互联 |


GPU 集群 & 多卡

|-----------|-------------------|------|
| 缩略语 | 全称 | 说明 |
| DP | Data Parallel | 数据并行 |
| MP | Model Parallel | 模型并行 |
| PP | Pipeline Parallel | 流水并行 |
| TP | Tensor Parallel | 张量并行 |
| AllReduce | --- | 梯度同步 |


五、数据中心 & DPU

BlueField / DPU

|-----------|----------------------|------------|
| 缩略语 | 全称 | 说明 |
| DPU | Data Processing Unit | 数据处理器 |
| BlueField | --- | NVIDIA DPU |
| DOCA | --- | DPU SDK |
| Arm | --- | DPU CPU |
| Offload | --- | 卸载 CPU 工作 |


六、软件栈 & 驱动相关

|--------------|---------------------------|----------|
| 缩略语 | 全称 | 说明 |
| CUDA Driver | --- | 内核态驱动 |
| CUDA Runtime | --- | 用户态 API |
| PTX | Parallel Thread Execution | 中间 IR |
| SASS | --- | GPU 汇编 |
| JIT | Just-In-Time | 运行期编译 |
| NVCC | NVIDIA CUDA Compiler | CUDA 编译器 |
| Nsight | --- | 性能分析工具 |


七、图形 & 光追(RTX 体系)

|---------|------------------------------|--------|
| 缩略语 | 全称 | 说明 |
| RTX | Ray Tracing Texel | 光追品牌 |
| RT Core | --- | 光追硬件 |
| BVH | Bounding Volume Hierarchy | 光追加速结构 |
| DLSS | Deep Learning Super Sampling | AI 超分 |
| OptiX | --- | 光追 SDK |


八、NVIDIA 芯片/封装/工艺相关

|------------|----------------------------|-----------|
| 缩略语 | 全称 | 说明 |
| CoWoS | Chip on Wafer on Substrate | 台积电封装 |
| HBM3 | --- | 高带宽显存 |
| HBM3e | --- | H100/B200 |
| Chiplet | --- | 小芯片 |
| Interposer | --- | 硅中介层 |
| TSMC | --- | 台积电 |

相关推荐
魏杨杨8 小时前
一个程序员眼中的 AI 核心概念,讲透 LLM 、Agent 、MCP 、Skill 、RAG...
ai·.net·agent·claude code
RyFit9 小时前
SpringAI 常见问题及解决方案大全
java·ai
元拓数智9 小时前
智能分析落地卡壳?先补好「数据关系+语义治理」这层技术基建
大数据·分布式·ai·spark·数据关系·语义治理
企学宝9 小时前
企学宝5月专题课程丨《OpenClaw AI 智能体实战营:从零基础部署到全场景自动化落地》
人工智能·ai·企业培训
malog_13 小时前
大语言模型后训练全解析
人工智能·深度学习·机器学习·ai·语言模型
低代码行业资讯14 小时前
五大实锤证据:AI不会终结低代码,只会倒逼技术进化
低代码·ai
神秘的土鸡14 小时前
Agent 落地:贴合健身真实场景的 AI 人物跟练方案
ai·语言模型·agent
常威正在打来福14 小时前
frontend-design 入门指南:OpenClaw / Claude Code / Codex 三平台安装教程
人工智能·ai·ai编程
武子康14 小时前
调查研究-140 全球机器人产业深度调研报告【02篇】:全球机器人产业格局分析:五个阶段并存与商业化路径 2026
人工智能·ai·机器人·具身智能·智能化
SZLSDH14 小时前
场景适配论 | 数字孪生IOC建设中渲染技术与智能体能力的协同逻辑
前端·数据库·ai·数字孪生·数据可视化·智能体