技术栈

通信库

predawnlove
5 小时前
nccl·通信库
【NCCL】8 PAT AllGather 设备端实现详解3PatAGAlgorithm::getNextOp() 函数的算法规划是 PAT (Pipelined Allgather Tree) 算法的核心调度器。
predawnlove
7 天前
gpu·nccl·通信库
【NCCL】3. ncclPrepareTasks 到 scheduleCollTasksToPlan 的衔接机制Commit: 59242d7cncclPrepareTasks 之后如何衔接到 scheduleCollTasksToPlan 的完整流程。关键在于 ncclLaunchPrepare 函数。
我是有底线的