华为集合通信库开源了!HCCL开源链接、架构、拓扑算法、常用接口

激动啊!我们华为HCCL终于开源了!

视频分享在这:

华为集合通信库开源了!HCCL开源链接、拓扑算法、常用接口_哔哩哔哩_bilibili

一、HCCL相关链接

源码位置(需注册华为账号才可下载)

cann-hccl: cann-hccl,是基于昇腾硬件的高性能集合通信库(Huawei Collective Communication Library,简称HCCL)。

HCCL主页

HCCL-昇腾社区

HCCL官方视频教程

昇腾社区-官网丨昇腾万里 让智能无所不及

HCCL文档

HCCL接口简介-集合通信接口-CANN商用版8.0.RC2开发文档-昇腾社区

HCCL性能测试工具

工具介绍-HCCL性能测试工具-训练推理开发工具-开发工具-CANN商用版8.0.RC2开发文档-昇腾社区

二、HCCL介绍

2.1 概述

华为集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,提供单机多卡以及多机多卡间的数据并行、模型并行集合通信方案。

HCCL的软件架构如下图所示,分为"通信框架"、"通信算法"与"通信平台"三个模块,本源码仓中包含了其中紫色底纹所示的"通信框架 "与"通信算法"两个模块的源码。

  • 适配层,图引擎与单算子适配,进行通信切分寻优等操作。
  • 集合通信业务层,包括通信框架与通信算法两个模块:
    • 通信框架:负责通信域管理,通信算子的业务串联,协同通信算法模块完成算法选择,协同通信平台模块完成资源申请并实现集合通信任务的下发。
    • 通信算法:作为集合通信算法的承载模块,提供特定集合通信操作的资源计算,并根据通信域信息完成通信任务编排。
  • 集合通信平台层,提供NPU之上与集合通信关联的资源管理,并提供集合通信维测能力。

2.2 支持的拓扑算法

HCCL源码仓提供了Mesh、Ring、Recursive Halving-Doubling(RHD)、PairWise四种拓扑算法的实现源码。

算法 描述 原理与耗时
Mesh Server内通信算法,是Mesh互联拓扑的基础算法。 Mesh
Ring Server内和Server间通信算法,是基于环结构的并行调度算法。 Server间通信场景下,适用于小规模节点数(<32机,且非2幂)和中大规模通信数据量(>=256M)的场景。 Ring
RHD Server间通信算法,递归二分和倍增算法,当通信域内Server个数为2的整数次幂时,此算法具有较好的亲和性。 RHD
Pairwise Server间通信算法,比较算法,仅用于AllToAll与AlltoAllV算子,适用于数据量较小(<=1M * RankSize)的场景。 PairWise
Star Server内通信算法,Star算法适用于有根节点的通信操作(如Broadcast、Reduce、Gather、Scatter等),利用星型拓扑或全连接拓扑一步完成通信操作。 Star

2.2.1 服务器内的Ring拓扑

如下图所示,可构建4个逻辑ring环:

左图的黄线表示PCIe,蓝线表示HCCS(High-speed Custom Communication System)是华为为其昇腾(Ascend)系列 AI 处理器设计的高速互连技术。

2.2.2 服务器间的Halving doubling

2.2.2 服务器内和间拓扑算组合

这里针对AllReduce集合通信

框内代表服务器内,框间代表服务器间。

三、HCCL常用接口

四、源码居然有一些中文注释

多少年源码里面没看到中文了,看的我快哭了!

相关推荐
一只栖枝4 小时前
华为 HCIE 大数据认证中 Linux 命令行的运用及价值
大数据·linux·运维·华为·华为认证·hcie·it
ajassi200018 小时前
开源 Arkts 鸿蒙应用 开发(十八)通讯--Ble低功耗蓝牙服务器
华为·开源·harmonyos
前端世界19 小时前
在鸿蒙应用中快速接入地图功能:从配置到实战案例全解析
华为·harmonyos
江拥羡橙20 小时前
【基础-判断】HarmonyOS提供了基础的应用加固安全能力,包括混淆、加密和代码签名能力
安全·华为·typescript·harmonyos
前端世界1 天前
HarmonyOS 实战:用 @Observed + @ObjectLink 玩转多组件实时数据更新
华为·harmonyos
ajassi20001 天前
开源 Arkts 鸿蒙应用 开发(十六)自定义绘图控件--波形图
华为·开源·harmonyos
monster_风铃1 天前
华为实验 链路聚合
网络·华为
前端世界1 天前
鸿蒙任务调度机制深度解析:优先级、时间片、多核与分布式的流畅秘密
分布式·华为·harmonyos
YF云飞2 天前
.NET 在鸿蒙系统(HarmonyOS Next)上的适配探索与实践
华为·.net·harmonyos
范纹杉想快点毕业3 天前
《嵌入式 C 语言编码规范与工程实践个人笔记》参考华为C语言规范标准
服务器·c语言·stm32·单片机·华为·fpga开发·51单片机