新视频教程:分析和调试 NVIDIA CUDA 应用程序

这篇文章最初发表在 NVIDIA 技术博客上。

NVIDIA CUDA 教程视频系列第 5 集已经发布。 NVIDIA 计算开发工具产品经理 Jackson Marusarz 介绍了一套工具,可帮助您构建、调试和优化 CUDA 应用程序,使开发变得简单高效。

这包括:

**IDE 和调试器:**与流行的 IDE 集成,如 NVIDIA Nsight Visual Studio EditionNVIDIA Nsight Visual Studio Code EditionNVIDIA Nsight Eclipse,都可以简化 CUDA 应用程序的代码开发和调试。这些工具将熟悉的基于 CPU 的编程工作流用于 GPU 开发,提供智能感知和代码完成等功能。

全系统见解: NVIDIA Nsight Systems 提供系统范围的性能见解、CPU 进程、GPU 流和资源瓶颈的可视化。它还跟踪 API 和库,帮助开发人员找到优化机会。

CUDA 内核评测: NVIDIA Nsight Compute 能够对 CUDA 内核性能进行详细分析。它收集硬件和软件计数器,并使用内置的专家系统进行问题检测和性能分析。

NVIDIA CUDA 教程视频系列的第 5 集已经发布。在这个视频中,NVIDIA 的计算开发工具产品经理 Jackson Marusarz 将帮助您构建、调试和优化 CUDA 应用程序,使开发过程变得更加容易和高效。

了解每个工具的关键功能,并发现最适合您需求的工具。

资源

阅读原文

相关推荐
扫地的小何尚4 小时前
Isaac Lab 2.3深度解析:全身控制与增强遥操作如何重塑机器人学习
arm开发·人工智能·学习·自然语言处理·机器人·gpu·nvidia
攻城狮7号8 天前
NVIDIA开源Audio2Face模型与SDK,数字人表情迎来“灵魂”时刻
人工智能·nvidia·开源模型·audio2face
Jzzzzzzzzzzzzzz9 天前
NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.
ubuntu·nvidia·显卡驱动
深度学习机器12 天前
解密vLLM:基于nano-vllm源码剖析其推理加速之道
pytorch·llm·nvidia
扫地的小何尚12 天前
NVIDIA Dynamo深度解析:如何优雅地解决LLM推理中的KV缓存瓶颈
开发语言·人工智能·深度学习·机器学习·缓存·llm·nvidia
扫地的小何尚13 天前
CUDA 13.0深度解析:统一ARM生态、UVM增强与GPU共享的革命
arm开发·人工智能·自然语言处理·gpu·nvidia·jetson·nvidia thro
扫地的小何尚15 天前
R²D²深度解析:NVIDIA三大神经网络突破如何变革机器人学习
神经网络·r语言·机器人·llm·gpu·nvidia
扫地的小何尚16 天前
深度解析 CUDA-QX 0.4 加速 QEC 与求解器库
人工智能·语言模型·llm·gpu·量子计算·nvidia·cuda
阿里云大数据AI技术18 天前
阿里云 PAI 携手 NVIDIA 提供端到端物理 AI 解决方案
人工智能·nvidia
放羊郎1 个月前
配置Nvidia JETSON AGX Xavier
nvidia·虚拟机·jetson·刷机·重装系统·xavier