3月24日直播丨HCCL集合通信专用引擎CCU技术介绍

在AI计算集群规模持续扩大的背景下,集合通信效率成为影响系统整体性能的关键因素。集合通信处理器(CCU)是昇腾NPU中用于加速集合通信任务的专用协处理器,其主要目标是解决传统通信方式中性能瓶颈,提升整体系统性能。

关键组成部分

  1. CCUM和CCUA单元

    • CCUM:控制单元,解析任务描述符并执行通信任务。

    • CCUA:数据处理单元,处理数据传输和规约。

  2. 基本构成单元

    • Memory Slice (MS):4KB片上缓存。

    • Gather Scatter Address (GSA):存储内存地址的寄存器。

    • General Purpose Register (Xn):存储数据长度和循环控制信息。

    • Checklist Entry (CKE):16bit同步寄存器,用于NPU间同步。

功能特性亮点

CCU支持完整的指令集 ,包括加载、运算、控制、同步、传输和规约等操作类型,能够高效完成集合通信任务。在典型应用场景中,Reduce操作 通过降低读写次数,解决规约确定性和精度损失问题;Broadcast操作支持

B站直播预约链接:点击预约

相关推荐
昇腾CANN1 天前
从微观到介观:MCE SIG突破算力瓶颈的DPD算子已开源
昇腾·cann
昇腾CANN1 天前
CANN NEXT系列干货:面向950的架构详解
昇腾·cann
昇腾CANN2 天前
【CANNBot学习周】4.13~4.16入门课程来袭
昇腾·cann
红目香薰3 天前
Ascend C 算子:Sigmoid 函数原理深入解析与工程化构建及验证
c语言·开发语言·华为·华为云·昇腾·cann·modelarts
handsomestWei5 天前
华为昇腾DeepSeek模型部署
昇腾·ascend·huawei·大模型部署·deepseek
昇腾CANN11 天前
4月3日直播丨CANNBot发布:畅享算子开发新体验
昇腾·cann
摘星编程15 天前
开源力量:GitCode+昇腾NPU 部署Mistral-7B-Instruct-v0.2模型的技术探索与经验总结
华为·开源·huggingface·gitcode·昇腾
昇腾CANN16 天前
HIXL快速适配NIXL昇腾后端
cann
昇腾CANN23 天前
3月23日直播丨HiF8高效数据格式及其应用
昇腾·cann