cuda

闻道且行之1 天前
windows·深度学习·cuda·cudnn
Windows|CUDA和cuDNN下载和安装,默认安装在C盘和不安装在C盘的两种方法本篇文章将详细介绍在Windows操作系统中配置CUDA和cuDNN的步骤。通过本教程,您将能够轻松完成CUDA和cuDNN的安装、环境变量配置以及与深度学习框架(如TensorFlow和PyTorch)兼容性测试,从而为您的深度学习项目提供强大的硬件支持。无论您是深度学习的初学者,还是有一定经验的开发者,本篇文章都将帮助您快速搭建起高效的GPU加速开发环境。
seasonsyy1 天前
python·深度学习·环境配置·cuda
2.安装CUDA详细步骤(含安装截图)第一步:安装anaconda 注意:安装CUDA之前需要安装好anaconda,详见安装anaconda详细步骤(含安装截图)
点云SLAM3 天前
人工智能·pytorch·python·深度学习·3d·cuda·多gpu训练
Pytorch中cuda相关操作详见和代码示例在 PyTorch 中,CUDA 是用于加速深度学习计算的重要接口。下面将从 基础概念、常用操作、代码示例 等方面详解 PyTorch 中的 CUDA 操作。
mpr0xy4 天前
ai·ffmpeg·nvidia·cuda
编译支持cuda硬件加速的ffmpeg本来以为很简单,因为印象中自己在windows机器上使用过。目前的实在一个docker环境下的ubuntu系统里。
ouliten7 天前
笔记·cuda
cuda编程笔记(9)--使用 Shared Memory 实现 tiled GEMMtiled GEMM 是在 GPU 上使用 共享内存(Shared Memory)优化通用矩阵乘法(GEMM, General Matrix Multiply) 的一种经典方法,其核心思想是 将大矩阵拆分为更小的 tile(子块),再通过共享内存提高缓存命中率和并行计算效率。
ZhiqianXia10 天前
cuda
片上网络(NoC)拓扑结构比较在片上网络(Network-on-Chip, NoC)的设计中,节点度(Node Degree)、**对分带宽(Bisection Bandwidth)和网络直径(Network Diameter)**是三个关键的拓扑结构评估指标,它们直接影响NoC的性能、效率和适用性。以下详细解释这三个指标的定义、作用及其在NoC设计中的意义,并以表格形式整理。
木子杳衫20 天前
显卡·cuda
显卡 | CUDACUDA是NVIDIA为其图像处理器(GPU)开发的并行计算平台和编程模型,它与显卡的关系密不可分、相互成就。
William.csj23 天前
pytorch·cuda
Pytorch/CUDA——flash-attn 库编译的 gcc 版本问题flash-attn 是一个高性能 CUDA 加速库,编译时 对 gcc(或 g++)版本是有严格要求的,因为它需要和 NVIDIA CUDA Toolkit 的版本匹配。 如果 gcc 太新或太旧,nvcc 会直接报错 或编译出来的不兼容。
野蛮人6号25 天前
cuda
如何查看自己电脑的CUDA版本?在搜索栏输入命令提示符打开输入图片中的两个是CUDA版本和显卡的信息
SHIPKING3931 个月前
人工智能·深度学习·cuda·cudnn
【CUDA&cuDNN安装】深度学习基础环境搭建目录前言一、检查CUDA 版本必须与电脑的显卡型号匹配1.1 确定你的显卡型号1.1.1【可能遇到错误】
咩咩大主教1 个月前
c++·vscode·cmake·visual studio·cuda·cpp·cuda c++
2025最新版使用VSCode和CMake图形化编译调试Cuda C++程序(保姆级教学)VSCode+CMake简直就是C++程序开发者的福音,无论是进行Qt开发,音视频开发,后端程序开发,Cuda开发,CMake都是神一样的存在。
量化投资和人工智能1 个月前
c++·人工智能·python·机器学习·云计算·cuda
【CUDA编程】OptionalCUDAGuard详解OptionalCUDAGuard 是 PyTorch 的 CUDA 工具库(c10/cuda)中用于安全管理 GPU 设备上下文的 RAII(Resource Acquisition Is Initialization)类。其核心作用是在特定代码块中临时切换 GPU 设备,并在退出作用域时自动恢复原设备状态,尤其适用于设备可能为“未指定”(nullopt)的场景。以下从作用、原理、用法和典型场景详细解析:
weiwei228441 个月前
gpu·vs2019·cuda
VS2019+CUDA12.5入门通常先装vs后装cuda,cuda会自动集成到vs中。而如果先装cuda,后装vs则需要进行额外的配置。
爱串门的小马驹2 个月前
vscode·gpu·cuda
VScode编译调试debug,gpu的cuda程序,Nsight进行下面操作的前提是,我们的环境已经能跑简单的CUDA程序了。注意:名称一定是main.cu,和上面的json文件中的main对应。
阿巴阿阿巴巴巴巴2 个月前
人工智能·pytorch·python·深度学习·jupyter·cuda
【深度学习相关安装及配环境】Anaconda搭建虚拟环境并安装CUDA、cuDVV和对应版本的Pytorch,并在jupyter notebook上部署当前cuda版本为12.8 也可以在 桌面——打开NVIDIA控制面板——系统信息——组件——3D设置 查看cuda版本,上面直接输命令行比较方便
r0ysue_2 个月前
cuda·驱动·5060ti
5060显卡驱动PyCUDA开发环境搭建本文手把手讲解了RTX5060ti显卡从上手尝试折腾,到在最新Ubuntu LTS版本上CUDA开发环境搭建成功的详细流程。
易·木2 个月前
visual studio·cuda
在Visual Studio中进行cuda编程首先下载与CUDA Toolkit匹配的Visual Studio版本比如我的CUDA Toolkit版本是12.6,那么我可以使用2022的Visual Studio。
weixin_428498492 个月前
c++·cuda
NVC++ 介绍与使用指南NVC++ 是 NVIDIA 提供的基于 LLVM 的 C++ 编译器,专为 GPU 加速计算设计,支持最新的 C++ 标准并针对 NVIDIA GPU 进行了优化。
秣厉科技2 个月前
opencv·labview·dnn·cuda·秣厉
【秣厉科技】LabVIEW工具包——OpenCV 教程(21):CUDA 加速方案安装配置 CUDA + cuDNN 环境 参考教程:【番外】01:Windows 安装配置 CUDA 和 cuDNN 教程
csdnzzt2 个月前
性能优化·矩阵·cuda
CUDA编程——性能优化基本技巧本文主要介绍下面三种技巧:先摆出一个知识点,一般来说,Compute-bound 的 Kernel 不太常见,常见的 Compute-bound 的 Kernel 可能只有矩阵乘法与卷积核比较大的卷积,大多数都是Memory-bound,所以下面我们主要关注如何优化访存。