【GPU性能】英伟达 vs海思:GPU性能一览

英伟达GPU L2/T4/A10/A10G/V100对比:

英伟达A100/A800/H100/H800/华为Ascend 910B对比:

一句话总结,H100 vs. A100:3 倍性能,2 倍价格

值得注意的是,HCCS vs. NVLINK的GPU 间带宽。

对于 8 卡 A800 和 910B 模块而言,910B HCCS 的总带宽为392GB/s,与 A800 NVLink (400GB/s) 相当。然而,两者之间也存在一些区别。

NVIDIA NVLink采用全网状拓扑,如下所示,(双向)GPU-to-GPU 最大带宽可达到400GB/s (需要注意的是,下方展示的是8A100模块时的600GB/s速率,8 A800也是类似的全网状拓扑);

华为HCCS采用对等拓扑(没有 NVSwitch 芯片之类的东西),所以(双向) GPU-to-GPU 最大带宽是56GB/s;

H20/L20/Ascend 910B对比:

相关推荐
二蛋和他的大花9 小时前
HarmonyOS运动开发:深度解析文件预览的正确姿势
华为·harmonyos
量子位1 天前
Day0 迁移、一键部署,华为开源的昇思 MindSpore 成为大模型开发的 “万能钥匙”
人工智能·华为
我睡醒再说1 天前
纯血Harmony NETX 5小游戏实践:2048(附源文件)
游戏·华为·harmonyos·arkts
程序员小刘1 天前
基于uni-app for HarmonyOS5 的跨平台组件库开发指南,以及组件示例
华为·uni-app·harmonyos
程序员小刘1 天前
基于鸿蒙 HarmonyOS 5 打车小程序案例
华为·小程序·harmonyos
Francek Chen1 天前
【华为Pura80系列】鸿蒙生态再升级:Pura 80 系列影像突破,WATCH 5 开启智能手表新纪元
华为·harmonyos·鸿蒙·智能手表·pura80·watch 5
茄子忍者烧纸尿裤1 天前
[HarmonyOSNext鸿蒙开发]11.ArkUI框架:Swiper、Grid布局与代码复用实战指南
华为·harmonyos
程序员小刘1 天前
UniApp组件封装,2025年最新HarmonyOS鸿蒙模块化开发项目式教程
华为·uni-app·harmonyos
程序员小刘1 天前
如何开始HarmonyOS 5与Godot引擎融合开发?
华为·游戏引擎·godot·harmonyos