技术栈

NCCL 中的一些辅助debug 知识点

Eloudy2024-07-08 19:45

1,调试nccl 启动kernel的方法

ncclLaunchKernel

cuLaunchKernelEx

ncclStrongStreamLaunchKernel

cudaLaunchKernel

ncclLaunchOneRank

cudaLaunchKernel

在 nccl lib 中,不存在使用<<<grid, block,,>>> 这种类似方式启动kernel的情景。

gdb ./example_test

(gdb) b ncclLaunchKernel

(gdb) c

(gdb) backtrace

2,

未完待续。。。

上一篇:phpcms 升级php8.3.8
下一篇:迭代器模式在金融业务中的应用及其框架实现
相关推荐
Soonyang Zhang
22 天前
nccl分析(三)——GPU-Initiated Networking(gin)数据发送过程分析
gin·nccl
Soonyang Zhang
25 天前
nccl分析(二)——RDMA带外建链过程
网络·nccl·集合通信
数据与后端架构提升之路
2 个月前
你的 GPU 为什么只能跑 20%?大模型训练通信瓶颈的四层排查 SOP
nccl·训练通信
d1z888
2 个月前
NCCL 测试完全指南:从概念到性能调优
gpu·nvidia·nccl
int WINGsssss
2 个月前
NCCL工作流程分析&&NCCL源码解读
nccl·ai infra·集合通信库·我爱吃烤肉
KIDGINBROOK
3 个月前
NVIDIA NCCL 源码学习(十七)- LL和LL128协议
cuda·rdma·nccl
bandaoyu
3 个月前
【NVSHMEM】PCIe 距离类型(PIX,PXB,PHB,NOD,SYS)和判断
nccl·rccl·nvshmem
三点水-here
4 个月前
04 - 分布式大模型推理实战:TP/PP/EP并行策略深度解析
分布式·rdma·nccl·moe·流水线并行·张量并行·专家并行
容沁风
5 个月前
lk_llama.cpp启用nccl
nccl·v100·lk_llama.cpp
热门推荐
01《置身钉内》原文-可播放阅读02【AI】2026 年具身智能模型和世界模型总结03GitHub 镜像站点04Claude Code、Codex、Cursor三分天下:2026年AI编程Agent生态全景剖析052026 AI 编程工具终极实战指南:Cursor vs Claude Code vs Copilot,开发者该怎么选?06Codex 下载安装指南:Windows 和 macOS 官方版下载072026 年 AI 编程工具终极横评:Cursor vs Claude Code vs Copilot vs Windsurf08AI科技热点日报 | 2026年6月1日09【踩坑记录 | 第一篇】微软商店无法使用时,如何手动安装 OpenAI Codex?附`.msix`文件系统错误解决方法10CC-Switch 下载、安装与使用配置指南【2026.5.29】