【GPU性能】英伟达 vs海思:GPU性能一览

英伟达GPU L2/T4/A10/A10G/V100对比:

英伟达A100/A800/H100/H800/华为Ascend 910B对比:

一句话总结,H100 vs. A100:3 倍性能,2 倍价格

值得注意的是,HCCS vs. NVLINK的GPU 间带宽。

对于 8 卡 A800 和 910B 模块而言,910B HCCS 的总带宽为392GB/s,与 A800 NVLink (400GB/s) 相当。然而,两者之间也存在一些区别。

NVIDIA NVLink采用全网状拓扑,如下所示,(双向)GPU-to-GPU 最大带宽可达到400GB/s (需要注意的是,下方展示的是8A100模块时的600GB/s速率,8 A800也是类似的全网状拓扑);

华为HCCS采用对等拓扑(没有 NVSwitch 芯片之类的东西),所以(双向) GPU-to-GPU 最大带宽是56GB/s;

H20/L20/Ascend 910B对比:

相关推荐
Hi202402173 小时前
CUDA cooperative_groups grid_group测试
gpu·cuda·gpgpu
训山4 小时前
【11】纯血鸿蒙HarmonyOS NEXT星河版开发0基础学习笔记-模块化语法与自定义组件
笔记·学习·华为·harmonyos·鸿蒙系统
helloxmg6 小时前
鸿蒙harmonyos next flutter混合开发之开发package
flutter·华为·harmonyos
东林知识库1 天前
鸿蒙NEXT开发-自定义构建函数(基于最新api12稳定版)
华为·harmonyos
真正的醒悟1 天前
华为资源分享
运维·服务器·华为
鸿蒙自习室2 天前
鸿蒙网络管理模块04——网络连接管理
华为·harmonyos·鸿蒙·媒体
Yeats_Liao2 天前
华为开源自研AI框架昇思MindSpore应用案例:计算高效的卷积模型ShuffleNet
人工智能·深度学习·华为
cn_mengbei2 天前
HUAWEI New4.9G 与 2.6G 无法正常切换问题处理案例
网络·华为
叶庭云2 天前
了解华为计算产品线,昇腾的业务都有哪些?
人工智能·华为·昇腾·计算产品线·ai 大模型时代
训山2 天前
【10】纯血鸿蒙HarmonyOS NEXT星河版开发0基础学习笔记-泛型基础全解(泛型函数、泛型接口、泛型类)及参数、接口补充
笔记·学习·华为·harmonyos·鸿蒙系统