技术栈

NCCL 中的一些辅助debug 知识点

Eloudy2024-07-08 19:45

1,调试nccl 启动kernel的方法

ncclLaunchKernel

cuLaunchKernelEx

ncclStrongStreamLaunchKernel

cudaLaunchKernel

ncclLaunchOneRank

cudaLaunchKernel

在 nccl lib 中,不存在使用<<<grid, block,,>>> 这种类似方式启动kernel的情景。

gdb ./example_test

(gdb) b ncclLaunchKernel

(gdb) c

(gdb) backtrace

2,

未完待续。。。

上一篇:phpcms 升级php8.3.8
下一篇:迭代器模式在金融业务中的应用及其框架实现
相关推荐
容沁风
23 天前
lk_llama.cpp启用nccl
nccl·v100·lk_llama.cpp
predawnlove
1 个月前
【NCCL】8 PAT AllGather 设备端实现详解3
nccl·通信库
predawnlove
1 个月前
【NCCL】4 AllGather-PAT算法
算法·gpu·nccl
predawnlove
1 个月前
【NCCL】5 GPU 间链路 Preconnect 机制
gpu·nccl
predawnlove
1 个月前
【NCCL】3. ncclPrepareTasks 到 scheduleCollTasksToPlan 的衔接机制
gpu·nccl·通信库
七宝大爷
3 个月前
多GPU并行计算互联架构解析:NVLink的诞生与SLI CrossFire的落幕
架构·nvlink·sli
Luchang-Li
5 个月前
sglang pytorch NCCL hang分析
pytorch·python·nccl
小马敲马
6 个月前
[4.2-2] NCCL新版本的register如何实现的?
开发语言·c++·人工智能·算法·性能优化·nccl
caodongwang
9 个月前
【NCCL】transport建立(一)
p2p·rdma·nccl·transport
跑步去兜风
1 年前
RCCL/NCCL中的Transports方式选择:P2P or SHM or NET
服务器·p2p·nccl·shm·rccl
热门推荐
01GitHub 镜像站点02Claude Code + GLM4.7 避坑指南:解决 Unable to connect to Anthropic services03使用 1panel面板 部署 php网站04Vue-skills的中文文档05OpenClaw Chrome扩展使用教程 - 浏览器中继控制06从零搭建一个 PHP 登录注册系统(含完整源码)07让 Trae IDE 智能体 “读懂”文档 Excel+PDF+DOCX :mcp-documents-reader 工具使用指南08一文了解国产算子编程语言 TileLang,TileLang 对国产开源生态的影响与启示09UV安装并设置国内源10Linux下V2Ray安装配置指南