新视频教程:分析和调试 NVIDIA CUDA 应用程序

这篇文章最初发表在 NVIDIA 技术博客上。

NVIDIA CUDA 教程视频系列第 5 集已经发布。 NVIDIA 计算开发工具产品经理 Jackson Marusarz 介绍了一套工具,可帮助您构建、调试和优化 CUDA 应用程序,使开发变得简单高效。

这包括:

**IDE 和调试器:**与流行的 IDE 集成,如 NVIDIA Nsight Visual Studio EditionNVIDIA Nsight Visual Studio Code EditionNVIDIA Nsight Eclipse,都可以简化 CUDA 应用程序的代码开发和调试。这些工具将熟悉的基于 CPU 的编程工作流用于 GPU 开发,提供智能感知和代码完成等功能。

全系统见解: NVIDIA Nsight Systems 提供系统范围的性能见解、CPU 进程、GPU 流和资源瓶颈的可视化。它还跟踪 API 和库,帮助开发人员找到优化机会。

CUDA 内核评测: NVIDIA Nsight Compute 能够对 CUDA 内核性能进行详细分析。它收集硬件和软件计数器,并使用内置的专家系统进行问题检测和性能分析。

NVIDIA CUDA 教程视频系列的第 5 集已经发布。在这个视频中,NVIDIA 的计算开发工具产品经理 Jackson Marusarz 将帮助您构建、调试和优化 CUDA 应用程序,使开发过程变得更加容易和高效。

了解每个工具的关键功能,并发现最适合您需求的工具。

资源

阅读原文

相关推荐
basketball6162 天前
AI Infra 硬件体系与编程模型:17. CUDA编程基础:底层驱动 API 调用
人工智能·microsoft·nvidia·cuda
basketball6165 天前
AI Infra 硬件体系与编程模型:14. CUDA编程基础:事件与精确性能测量
人工智能·nvidia·cuda
kyle~5 天前
推理部署---CUDA 执行模型(SM、Block、Warp 与 SIMT)
人工智能·nvidia·cuda
basketball6165 天前
AI Infra 硬件体系与编程模型:15. CUDA编程基础:混合精度计算
人工智能·nvidia·cuda
小白狮ww5 天前
3B 参数,毫秒级响应:LocateAnything 如何重新定义开放世界目标检测
人工智能·目标检测·计算机视觉·视觉检测·大语言模型·nvidia·locateanything
kyle~7 天前
ROS 2 与 Isaac Sim 联合仿真(一)体系架构、环境选型与基础通信闭环
c++·机器人·nvidia·仿真·ros2
kyle~7 天前
ROS 2 与 Isaac Sim 联合仿真(三):工程化部署、性能优化、多机器人与 Sim-to-Real
机器人·nvidia·仿真·ros2
CV-deeplearning7 天前
NVIDIA CV-CUDA:GPU 全流程加速计算机视觉,pip 一键安装替代 OpenCV,微软/腾讯/百度/字节全在用,云级图像处理吞吐量飙升 10 倍
opencv·计算机视觉·pip·nvidia·cuda·gpu加速·cv-cuda
OpenCSG12 天前
Cosmos3:NVIDIA 把世界模型做成了“理解、生成、模拟、行动”的统一入口
人工智能·大模型·nvidia·opencsg