技术栈
cuda
r0ysue_
4 天前
cuda
·
驱动
·
5060ti
5060显卡驱动PyCUDA开发环境搭建
本文手把手讲解了RTX5060ti显卡从上手尝试折腾,到在最新Ubuntu LTS版本上CUDA开发环境搭建成功的详细流程。
易·木
4 天前
visual studio
·
cuda
在Visual Studio中进行cuda编程
首先下载与CUDA Toolkit匹配的Visual Studio版本比如我的CUDA Toolkit版本是12.6,那么我可以使用2022的Visual Studio。
weixin_42849849
8 天前
c++
·
cuda
NVC++ 介绍与使用指南
NVC++ 是 NVIDIA 提供的基于 LLVM 的 C++ 编译器,专为 GPU 加速计算设计,支持最新的 C++ 标准并针对 NVIDIA GPU 进行了优化。
秣厉科技
14 天前
opencv
·
labview
·
dnn
·
cuda
·
秣厉
【秣厉科技】LabVIEW工具包——OpenCV 教程(21):CUDA 加速方案
安装配置 CUDA + cuDNN 环境 参考教程:【番外】01:Windows 安装配置 CUDA 和 cuDNN 教程
csdnzzt
14 天前
性能优化
·
矩阵
·
cuda
CUDA编程——性能优化基本技巧
本文主要介绍下面三种技巧:先摆出一个知识点,一般来说,Compute-bound 的 Kernel 不太常见,常见的 Compute-bound 的 Kernel 可能只有矩阵乘法与卷积核比较大的卷积,大多数都是Memory-bound,所以下面我们主要关注如何优化访存。
Milton
16 天前
cuda
·
3d gaussian splatting
3D Gaussian Splatting 查看工具 splatviz
3D Gaussian Splatting 仓库自带的 SIBR Viewer 运行对显卡有要求, 需要 CUDA_ARCHITECTURE >= 7.x, 在 RTX 4060Ti 上可以运行, 但是在 P104-100 上就会提示"Sorry, need at least compute capability 7.0+!"后退出. 因此需要寻找一个兼容性更好的查看工具.
PLUS_WAVE
1 个月前
服务器
·
c++
·
bug
·
环境
·
编译
·
cuda
·
ld
【CUDA 编译 bug】ld: cannot find -lcudart
我们使用 Conda 安装 pytorch 和 CUDA 环境之后,要用 Conda 的CUDA环境进行某个库编译时,出现了bug:
程序员非鱼
1 个月前
人工智能
·
深度学习
·
神经网络
·
cuda
(2025最新版)CUDA安装及环境配置
学习深度学习的小伙伴在配置环境的时候必不可少的一件事就是安装CUDA,在这个过程中也是容易踩很多坑,所以这里写一篇教程来帮助新入门的小伙伴快速安装CUDA,减少踩坑。
停走的风
2 个月前
学习
·
cuda
·
jetson
jetson orin nano学习(torch+OpenCV+yolov5+)
指令:nvidia-smi -h 帮助命令 sudo jtop --查看nvidia的gpu状态Tip:教程下载的pytorth,cuda,cudnn版本不一定是你项目符合的,要提前想好
musk1212
2 个月前
yolo
·
cuda
·
wsl2
YOLO环境搭建,win11+wsl2+ubuntu24+cuda12.6+idea
提示:环境搭建提示:版本 win11 wsl2 ubuntu24 idea 2024子系统跳过,参考之前笔记 win11 设置 wsl2 ubuntu
哦豁灬
2 个月前
学习
·
cuda
CUDA 学习(3)——CUDA 初步实践
CUDA 中提供了 blockIdx, threadIdx, blockDim, GridDim来定位发起 thread,下面发起 1 个 grid,里面有 2 个 block,每个 block 里有 5 个 threads。
扫地的小何尚
2 个月前
c++
·
人工智能
·
深度学习
·
gpu
·
nvidia
·
cuda
NVIDIA TensorRT 深度学习推理加速引擎详解
在当今人工智能和深度学习快速发展的时代,模型推理性能已成为实际应用中的关键瓶颈。无论是需要实时响应的自动驾驶系统,还是要处理海量数据的推荐引擎,亦或是资源受限的边缘设备上的AI应用,都对推理速度、延迟和能耗提出了严苛的要求。NVIDIA TensorRT作为一个高性能的深度学习推理优化器和运行时环境,正是为解决这些挑战而生。
哦豁灬
2 个月前
学习
·
cuda
CUDA 学习(2)——CUDA 介绍
GeForce 256 是英伟达 1999 年开发的第一个 GPU,最初用作显示器上渲染高端图形,只用于像素计算。
拿铁加椰果
2 个月前
pytorch
·
docker
·
容器
·
cuda
docker 内 pytorch cuda 不可用
拉的官方 docker 仓库里的镜像 nvidia/cuda:12.4.1-cudnn-devel-rockylinux8
陈 洪 伟
3 个月前
cuda
·
共享内存
·
全局内存
CUDA编程(4):共享内存:减少全局内存访问、合并全局内存访问
目录1 共享内存概述1.1 共享内存1.2 共享内存分配1.3 为什么要使用共享内存2 减少全局内存访问----以规约求和为例
System_sleep
3 个月前
windows
·
python
·
llama
·
cuda
win11编译llama_cpp_python cuda128 RTX30/40/50版本
Geforce 50xx系显卡最低支持cuda128,llama_cpp_python官方源只有cpu版本,没有cuda版本,所以自己基于0.3.5版本源码编译一个RTX 30xx/40xx/50xx版本。
nuczzz
3 个月前
kubernetes
·
k8s
·
gpu
·
nvidia
·
cuda
NVIDIA k8s-device-plugin源码分析与安装部署
在《kubernetes Device Plugin原理与源码分析》一文中,我们从源码层面了解了kubelet侧关于device plugin逻辑的实现逻辑,本文以nvidia管理GPU的开源github项目k8s-device-plugin为例,来看看设备插件侧的实现示例。
真昼小天使daisuki
3 个月前
linux
·
cuda
最简单的方式:如何在wsl2上配置CDUA开发环境
这篇文章可以帮助你以一个最为简单的方式迈出CUDA的第一步,从此一入CUDA深似海,从此头发是路人。前提:你需要在Windows 11上:
Cony_14
3 个月前
windows
·
vscode
·
cmake
·
cuda
Windows系统中在VSCode上配置CUDA环境
注:Windows 端笔者暂时没找到直接在VSCode中直接调试的方法,不过在Visual Studio中可以。
NullPointerExpection
3 个月前
c++
·
ffmpeg
·
makefile
·
cuda
ubuntu20.04已安装 11.6版本 cuda,现需要通过源码编译方式安装使用 cuda 加速的 ffmpeg 步骤