技术栈

NCCL 中的一些辅助debug 知识点

Eloudy2024-07-08 19:45

1,调试nccl 启动kernel的方法

ncclLaunchKernel

cuLaunchKernelEx

ncclStrongStreamLaunchKernel

cudaLaunchKernel

ncclLaunchOneRank

cudaLaunchKernel

在 nccl lib 中,不存在使用<<<grid, block,,>>> 这种类似方式启动kernel的情景。

gdb ./example_test

(gdb) b ncclLaunchKernel

(gdb) c

(gdb) backtrace

2,

未完待续。。。

上一篇:phpcms 升级php8.3.8
下一篇:迭代器模式在金融业务中的应用及其框架实现
相关推荐
d1z888
11 天前
NCCL 测试完全指南:从概念到性能调优
gpu·nvidia·nccl
int WINGsssss
13 天前
NCCL工作流程分析&&NCCL源码解读
nccl·ai infra·集合通信库·我爱吃烤肉
KIDGINBROOK
17 天前
NVIDIA NCCL 源码学习(十七)- LL和LL128协议
cuda·rdma·nccl
bandaoyu
1 个月前
【NVSHMEM】PCIe 距离类型(PIX,PXB,PHB,NOD,SYS)和判断
nccl·rccl·nvshmem
三点水-here
2 个月前
04 - 分布式大模型推理实战:TP/PP/EP并行策略深度解析
分布式·rdma·nccl·moe·流水线并行·张量并行·专家并行
容沁风
3 个月前
lk_llama.cpp启用nccl
nccl·v100·lk_llama.cpp
predawnlove
3 个月前
【NCCL】8 PAT AllGather 设备端实现详解3
nccl·通信库
predawnlove
4 个月前
【NCCL】4 AllGather-PAT算法
算法·gpu·nccl
predawnlove
4 个月前
【NCCL】5 GPU 间链路 Preconnect 机制
gpu·nccl
predawnlove
4 个月前
【NCCL】3. ncclPrepareTasks 到 scheduleCollTasksToPlan 的衔接机制
gpu·nccl·通信库
热门推荐
01GitHub 镜像站点02一周AI热点速览(2026.03.31-04.06):GPT-6曝光、谷歌开源Gemma 4、资本狂飙与模型军备竞赛03OpenClaw 请求超时 llm request timed out 怎么解决?3 种方案实测,附完整排查流程04AI 编程效率翻倍:Superpowers Skills 上手清单 + 完整指南05MySQL表约束详解:8大核心约束实战指南06实测!Gemma 4 成功跑在安卓手机上:离线 AI 助手终于来了07Oh My Codex 快速使用指南08VMware Workstation Pro 17 虚拟机完整安装教程(2026最新)09CodeBuddy与WorkBuddy深度对比:腾讯两款AI工具差异及实操指南10UV安装并设置国内源