HuaWei、NVIDIA 数据中心 AI 算力对比

Ascend 910B 是 HuaWei 于 2023 年推出的高性能 AI 处理器芯片，其对标产品为 Nvidia A100/A800，其算力表现如下：

峰值算力：Ascend 910B 的半精度（FP16）算力达到 256 TFLOPS（每秒 256 万亿次浮点运算）。
整数精度算力：Ascend 910B 的整数精度（INT8）算力达到 512 Tera-OPS。
单精度算力：Ascend 910B 的单精度（FP32）算力达到 128 TFLOPS。
能效比：Ascend 910B 的每瓦特性能达到 5.2 TFLOPS/W，相较于英伟达 A100 的每瓦特性能 4.7 TFLOPS/W，Ascend 910B 在能效上更优。
内存带宽：Ascend 910B 的内存带宽为 768 GB/s。
互连带宽：Ascend 910B 的芯片间互连带宽为 600GB/s，卡间互连带宽为 PCIe 4.0 x16，理论带宽 31.5GB/s。
功耗：Ascend 910B 的最大功耗为 350W。
AI 算力对比：科大讯飞与华为联合优化后，在他们的场景中 Ascend 910B 已经达到 NVIDIA A100 的性能。

NVIDIA H100 Tensor Core GPU

基于 PCIe 的 NVIDIA H100 NVL（带有 NVLink 桥接）利用 Transformer Engine、NVLink 和 188GB HBM3 内存，在任何数据中心提供最佳性能和轻松扩展，使大型语言模型成为主流

NVIDIA H200 Tensor Core GPU

基于 NVIDIA Hoppe 架构，NVIDIA H200 是首款提供 141GB（吉字节）HBM3e 内存、内存带宽达 4.8TB/s（太字节每秒）的 GPU

GB200 NVL72 架构组成：

将 36 个 Grace Blackwell 超级芯片组合在一起，包含 72 个 Blackwell GPU 和 36 个 Grace CPU，通过第五代 NVLink 技术相互连接
每个 Grace Blackwell 超级芯片包含两个高性能的 NVIDIA Blackwell Tensor Core GPU 和一个 NVIDIA Grace CPU，使用 NVIDIA NVLink-C2C 连接

码字不易，若觉得本文对你有用，欢迎 点赞 👍、分享 🚀 ，相关技术热点时时看🔥🔥🔥...