技术栈
cuda
闻道且行之
1 天前
windows
·
深度学习
·
cuda
·
cudnn
Windows|CUDA和cuDNN下载和安装,默认安装在C盘和不安装在C盘的两种方法
本篇文章将详细介绍在Windows操作系统中配置CUDA和cuDNN的步骤。通过本教程,您将能够轻松完成CUDA和cuDNN的安装、环境变量配置以及与深度学习框架(如TensorFlow和PyTorch)兼容性测试,从而为您的深度学习项目提供强大的硬件支持。无论您是深度学习的初学者,还是有一定经验的开发者,本篇文章都将帮助您快速搭建起高效的GPU加速开发环境。
seasonsyy
1 天前
python
·
深度学习
·
环境配置
·
cuda
2.安装CUDA详细步骤(含安装截图)
第一步:安装anaconda 注意:安装CUDA之前需要安装好anaconda,详见安装anaconda详细步骤(含安装截图)
点云SLAM
3 天前
人工智能
·
pytorch
·
python
·
深度学习
·
3d
·
cuda
·
多gpu训练
Pytorch中cuda相关操作详见和代码示例
在 PyTorch 中,CUDA 是用于加速深度学习计算的重要接口。下面将从 基础概念、常用操作、代码示例 等方面详解 PyTorch 中的 CUDA 操作。
mpr0xy
4 天前
ai
·
ffmpeg
·
nvidia
·
cuda
编译支持cuda硬件加速的ffmpeg
本来以为很简单,因为印象中自己在windows机器上使用过。目前的实在一个docker环境下的ubuntu系统里。
ouliten
7 天前
笔记
·
cuda
cuda编程笔记(9)--使用 Shared Memory 实现 tiled GEMM
tiled GEMM 是在 GPU 上使用 共享内存(Shared Memory)优化通用矩阵乘法(GEMM, General Matrix Multiply) 的一种经典方法,其核心思想是 将大矩阵拆分为更小的 tile(子块),再通过共享内存提高缓存命中率和并行计算效率。
ZhiqianXia
10 天前
cuda
片上网络(NoC)拓扑结构比较
在片上网络(Network-on-Chip, NoC)的设计中,节点度(Node Degree)、**对分带宽(Bisection Bandwidth)和网络直径(Network Diameter)**是三个关键的拓扑结构评估指标,它们直接影响NoC的性能、效率和适用性。以下详细解释这三个指标的定义、作用及其在NoC设计中的意义,并以表格形式整理。
木子杳衫
20 天前
显卡
·
cuda
显卡 | CUDA
CUDA是NVIDIA为其图像处理器(GPU)开发的并行计算平台和编程模型,它与显卡的关系密不可分、相互成就。
William.csj
23 天前
pytorch
·
cuda
Pytorch/CUDA——flash-attn 库编译的 gcc 版本问题
flash-attn 是一个高性能 CUDA 加速库,编译时 对 gcc(或 g++)版本是有严格要求的,因为它需要和 NVIDIA CUDA Toolkit 的版本匹配。 如果 gcc 太新或太旧,nvcc 会直接报错 或编译出来的不兼容。
野蛮人6号
25 天前
cuda
如何查看自己电脑的CUDA版本?
在搜索栏输入命令提示符打开输入图片中的两个是CUDA版本和显卡的信息
SHIPKING393
1 个月前
人工智能
·
深度学习
·
cuda
·
cudnn
【CUDA&cuDNN安装】深度学习基础环境搭建
目录前言一、检查CUDA 版本必须与电脑的显卡型号匹配1.1 确定你的显卡型号1.1.1【可能遇到错误】
咩咩大主教
1 个月前
c++
·
vscode
·
cmake
·
visual studio
·
cuda
·
cpp
·
cuda c++
2025最新版使用VSCode和CMake图形化编译调试Cuda C++程序(保姆级教学)
VSCode+CMake简直就是C++程序开发者的福音,无论是进行Qt开发,音视频开发,后端程序开发,Cuda开发,CMake都是神一样的存在。
量化投资和人工智能
1 个月前
c++
·
人工智能
·
python
·
机器学习
·
云计算
·
cuda
【CUDA编程】OptionalCUDAGuard详解
OptionalCUDAGuard 是 PyTorch 的 CUDA 工具库(c10/cuda)中用于安全管理 GPU 设备上下文的 RAII(Resource Acquisition Is Initialization)类。其核心作用是在特定代码块中临时切换 GPU 设备,并在退出作用域时自动恢复原设备状态,尤其适用于设备可能为“未指定”(nullopt)的场景。以下从作用、原理、用法和典型场景详细解析:
weiwei22844
1 个月前
gpu
·
vs2019
·
cuda
VS2019+CUDA12.5入门
通常先装vs后装cuda,cuda会自动集成到vs中。而如果先装cuda,后装vs则需要进行额外的配置。
爱串门的小马驹
2 个月前
vscode
·
gpu
·
cuda
VScode编译调试debug,gpu的cuda程序,Nsight
进行下面操作的前提是,我们的环境已经能跑简单的CUDA程序了。注意:名称一定是main.cu,和上面的json文件中的main对应。
阿巴阿阿巴巴巴巴
2 个月前
人工智能
·
pytorch
·
python
·
深度学习
·
jupyter
·
cuda
【深度学习相关安装及配环境】Anaconda搭建虚拟环境并安装CUDA、cuDVV和对应版本的Pytorch,并在jupyter notebook上部署
当前cuda版本为12.8 也可以在 桌面——打开NVIDIA控制面板——系统信息——组件——3D设置 查看cuda版本,上面直接输命令行比较方便
r0ysue_
2 个月前
cuda
·
驱动
·
5060ti
5060显卡驱动PyCUDA开发环境搭建
本文手把手讲解了RTX5060ti显卡从上手尝试折腾,到在最新Ubuntu LTS版本上CUDA开发环境搭建成功的详细流程。
易·木
2 个月前
visual studio
·
cuda
在Visual Studio中进行cuda编程
首先下载与CUDA Toolkit匹配的Visual Studio版本比如我的CUDA Toolkit版本是12.6,那么我可以使用2022的Visual Studio。
weixin_42849849
2 个月前
c++
·
cuda
NVC++ 介绍与使用指南
NVC++ 是 NVIDIA 提供的基于 LLVM 的 C++ 编译器,专为 GPU 加速计算设计,支持最新的 C++ 标准并针对 NVIDIA GPU 进行了优化。
秣厉科技
2 个月前
opencv
·
labview
·
dnn
·
cuda
·
秣厉
【秣厉科技】LabVIEW工具包——OpenCV 教程(21):CUDA 加速方案
安装配置 CUDA + cuDNN 环境 参考教程:【番外】01:Windows 安装配置 CUDA 和 cuDNN 教程
csdnzzt
2 个月前
性能优化
·
矩阵
·
cuda
CUDA编程——性能优化基本技巧
本文主要介绍下面三种技巧:先摆出一个知识点,一般来说,Compute-bound 的 Kernel 不太常见,常见的 Compute-bound 的 Kernel 可能只有矩阵乘法与卷积核比较大的卷积,大多数都是Memory-bound,所以下面我们主要关注如何优化访存。