架构发展史

GPU架构发展史

文章目录


前言

英伟达的GPU架构发展


Kelvin

Kelvin 于 2001 年发布,是 Nvidia 千年以来第一个新的 GPU 微架构。最初的 Xbox 游戏机使用带有 Kelvin 微架构的 NV2A GPU。 GeForce 3 和 GeForce 4 系列 GPU 是采用这种微架构发布的。

Rankine

Rankine 是 2003 年发布的 Kelvin 的后续产品,用于 GeForce 5 系列的 Nvidia GPU。 Rankine 支持顶点和片段程序,并将 VRAM 大小增加到 256MB。

Curie

Curie------GeForce 6 和 7 系列 GPU 使用的微架构------于 2004 年作为 Rankine 的继任者发布。Curie 将 VRAM 数量翻了一番,达到 512MB,并且是第一代支持 PureVideo 视频解码的 Nvidia GPU。

Tesla

Tesla GPU 微架构于 2006 年作为居里的继任者发布,为 Nvidia 的 GPU 产品线引入了几项重要变化。除了作为 GeForce 8、9、100、200 和 300 系列 GPU 使用的架构之外,Tesla 还被用于图形处理之外的用例的 Quadro 系列 GPU 使用。

令人困惑的是,Tesla 既是 GPU 微架构的名称,又是 Nvidia GPU 的品牌。 2020 年,英伟达决定停止使用特斯拉这个名称,以避免与流行的电动汽车品牌混淆。

Fermi

特斯拉的继任者费米于 2010 年发布。费米推出了多项增强功能,包括:

支持 512 个 CUDA 内核

64KB 的 RAM 和分区 L1 缓存/共享内存的能力

支持纠错码 (ECC)

Kepler

Kepler GPU 微架构作为 Fermi 2012 的继任者发布。对 Fermi 的主要改进包括:

一种新的流式多处理器架构,称为 SMX

支持 TXAA(一种抗锯齿方法)

CUDA 核心增加到 1536 个

耗电量少

支持通过 GPU 加速自动超频

支持 GPUDirect,它允许 GPU(在同一台计算机上或通过网络相互访问)在不访问 CPU 的情况下进行通信

Maxwell

2014 年发布的麦克斯韦是费米的继任者。根据 Nvidia 的说法,第一代 Maxwell GPU 与 Fermi 相比具有以下优势:

由于与控制逻辑分区、时钟门控、指令调度和工作负载平衡相关的增强,多处理器效率更高

每个流式多处理器上有 64KB 的专用共享内存

与 Fermi 使用的锁定/解锁范例相比,本机共享内存原子操作提供了性能改进

动态并行支持

Pascal

Pascal 在 2016 年接替 Maxwell。这个 Nvidia GPU 微架构提供了对 Maxwell 的改进,例如:

支持 NVLink 通信,与 PCIe 相比具有显着的速度优势

高带宽内存 2 (HBM2) - 4096 位内存总线,提供 720 GB 内存带宽

计算抢占

动态负载平衡以优化 GPU 资源利用率

Volta

Volta 是 2017 年发布的一个有点独特的微架构迭代。虽然以前的大多数微架构都用于消费类 GPU,但 Volta GPU 的营销目的是严格用于专业应用程序。 Volta 也是第一个使用张量核心的微架构。

张量核心是一种新型的处理核心,可以执行专门的数学计算。具体来说,张量核心执行支持人工智能和深度学习用例的矩阵运算。

Turing

Turing 于 2018 年发布,除了支持 Tensor Cores 之外,还包括许多以消费者为中心的 GPU。 Turing 是 Nvidia 广受欢迎的 Quadro RTX 和 * GeForce RTX 系列 GPU 使用的微架构。这些 GPU 支持实时光线追踪(又名 RTX),这对于虚拟现实 (VR) 等计算量大的应用程序至关重要。

Ampere

Ampere 微架构刚刚开始投放市场。 Ampere 旨在进一步实现高性能计算 (HPC) 和 AI 用例。 Ampere 的增强功能包括第三代 NVLink 和 Tensor 核心、结构稀疏性(将不需要的参数转换为零以启用 AI 模型训练)、第二代光线追踪核心、多实例 GPU (MIG) 以实现将 A100 GPU 逻辑分区为单个隔离和安全的 GPU 实例。

Hopper

Hopper 架构是 NVIDIA GPU 的第九代架构,2022 年发布。相较于 Ampere,Hopper 架构支持第四代 Tensor Core,且采用新型流式处理器,每个 SM 能力更强。Hopper 架构在计算能力、深度学习加速和图形功能方面带来新的创新和改进。


总结

引用:

原文链接:https://blog.csdn.net/kunhe0512/article/details/126247243

相关推荐
ITPUB-微风6 小时前
Service Mesh在爱奇艺的落地实践:架构、运维与扩展
运维·架构·service_mesh
大腕先生10 小时前
微服务环境搭建&架构介绍(附超清图解&源代码)
微服务·云原生·架构
文军的烹饪实验室11 小时前
处理器架构、单片机、芯片、光刻机之间的关系
单片机·嵌入式硬件·架构
猫头虎-人工智能11 小时前
NVIDIA A100 SXM4与NVIDIA A100 PCIe版本区别深度对比:架构、性能与场景解析
gpt·架构·机器人·aigc·文心一言·palm
阿里妈妈技术11 小时前
提效10倍:基于Paimon+Dolphin湖仓一体新架构在阿里妈妈品牌业务探索实践
架构
JAMES费12 小时前
figure机器人技术架构的演进初探——Helix人形机器人控制的革新
架构·机器人
程序员侠客行14 小时前
Spring事务原理详解 三
java·后端·spring·架构
WeiLai111217 小时前
面试基础--微服务架构:如何拆分微服务、数据一致性、服务调用
java·分布式·后端·微服务·中间件·面试·架构
菜鸟一枚在这19 小时前
深入剖析抽象工厂模式:设计模式中的架构利器
设计模式·架构·抽象工厂模式
Swift社区19 小时前
【微服务优化】ELK日志聚合与查询性能提升实战指南
spring·elk·微服务·云原生·架构