技术栈

hccl

嗝o゚
9 天前
昇腾·cann·hccl
昇腾CANN HCCL 多机训练:网络拓扑和通信优化两机八卡跑 LLaMA 训练,AllReduce 的带宽利用率只有 60%,模型训练速度上不去。多机训练的瓶颈通常不在 GPU/NPU 算力,而在网络通信。HCCL 是昇腾 NPU 的集合通信库,这篇文章实测不同网络拓扑下的通信效率,帮你把多机训练的带宽跑满。
zjun3021
1 年前
ascend·hccl·带宽测试·ascend-dmi
Ascend上如何进行通信带宽测试https://www.hiascend.com/developer/download/community/result?module=dl%2Bcann
爱串门的小马驹
2 年前
华为·hccl·集合通信
华为集合通信库开源了!HCCL开源链接、架构、拓扑算法、常用接口激动啊!我们华为HCCL终于开源了!视频分享在这:华为集合通信库开源了!HCCL开源链接、拓扑算法、常用接口_哔哩哔哩_bilibili
我是有底线的