nvidia

Chasing Aurora8 天前
人工智能·深度学习·gpu算力·nvidia·智能电视·英伟达·vgpu
深度学习 的GPU介绍GPU(Graphic Processing Unit)图形处理器 CPU (Central Processing Unit)中央处理器
小溪彼岸14 天前
nvidia
NVIDIA免费API的申请与配置小伙伴们大家好,我是小溪,见字如面。今天记录一下申请英伟达免费API的流程,希望对有需要的小伙伴有所帮助。对其他免费API内容感兴趣的小伙伴可以看往期内容:
清@尘15 天前
nvidia·cuda
查看显卡支持版本打开cmd命令NVIDIA-smi可安装的最高CUDA版本为12.92、CUDA下载 官网: https://developer.nvidia.com/cuda-toolkit-archive
小米的修行之路15 天前
nvidia·tensorrt·cuda·cudnn
NVIDI核心板cuda, cudnn,tensorrt安装方法1.jetson系列各种型号简介:2.nvidia jetson模块载板:3.cuda, cudnn,tensorrt二次开发包安装:
逸俊晨晖16 天前
目标检测·nvidia·tensorrtx
NVIDIA 4090 使用 TensorRTx 部署 YOLOv8TensorRT 8.6CUDA 11.7TensorRTx针对自定义网络做了比原生 TensorRT 更深度的优化。
逸俊晨晖20 天前
人工智能·yolo·目标检测·nvidia
NVIDIA 4090的8路1080p实时YOLOv8目标检测https://www.bilibili.com/video/BV1zQFsz9Eq6/拉流:通过FFmpeg解封装RTSP流(使用MP4文件推流模拟实时场景,主机拉取1080P RTSP流);
fleaxin23 天前
docker·操作系统·nvidia·统信
统信服务器操作系统V20(1070)安装过程从资源中心 | 统信UOS生态社区下载对应的系统版本。因为本次安装的服务器硬件是海光的,同时因为A版本gcc版本高于E版本:
安全二次方security²1 个月前
c++·人工智能·nvidia·cuda·断点·断言·性能分析计数器函数
CUDA C++编程指南(7.31&32&33&34)——C++语言扩展之性能分析计数器函数和断言、陷阱、断点函数每个多处理器都配备了一组16个硬件计数器,应用程序可以通过调用__prof_trigger()函数,用一条指令来递增这些计数器。
安全二次方security²1 个月前
c++·人工智能·nvidia·cuda·dpx·cuda c++编程指南
CUDA C++编程指南(7.25)——C++语言扩展之DPXDPX是一组函数,能够查找最多三个16位和32位有符号或无符号整数参数的最小值和最大值,以及融合加法和最小/最大值操作,并可选ReLU(钳制到零clamping to zero):
安全二次方security²1 个月前
c++·人工智能·nvidia·cuda·投票函数·匹配函数·vote
CUDA C++编程指南(7.19&20)——C++语言扩展之Warp投票函数和Warp匹配函数弃用通知:__any、__all和__ballot已在CUDA 9.0中对所有设备弃用。移除通知:当目标设备的计算能力为7.x或更高时,__any、__all和__ballot将不再可用,应改用它们的同步变体。
安全二次方security²1 个月前
c++·人工智能·nvidia·cuda·内存空间谓词函数·内存空间转化函数·address space
CUDA C++编程指南(7.15&16)——C++语言扩展之内存空间谓词和转化函数如果参数是空指针,本节描述的函数行为未定义。如果ptr包含全局内存空间中对象的通用地址,则返回1,否则返回0。
安全二次方security²1 个月前
c++·人工智能·nvidia·cuda·内存栅栏函数·同步函数·syncthreads
CUDA C++编程指南(7.5&6)——C++语言扩展之内存栅栏函数和同步函数CUDA编程模型假设设备采用弱序内存模型(weakly-ordered memory model),这意味着CUDA线程将数据写入共享内存、全局内存、页锁定主机内存或对等设备内存的顺序,并不一定是另一个CUDA线程或主机线程观测到的写入顺序。若两个线程在没有同步的情况下对同一内存位置进行读写操作,将导致未定义行为。
安全二次方security²1 个月前
c++·人工智能·nvidia·cuda·内存空间指定符·__shared__·__device__
CUDA C++编程指南(7.2)——C++语言扩展之变量内存空间指定符变量内存空间指定符表示设备上变量的内存位置。在设备代码中声明的自动变量,如果未使用本节描述的__device__、__shared__或__constant__内存空间限定符,通常存放在寄存器中。但在某些情况下,编译器可能会选择将其放置在本地内存中,这可能会对性能产生不利影响,具体细节请参阅设备内存访问。
安全二次方security²1 个月前
c++·人工智能·nvidia·cuda·cuda编程·global·函数执行空间指定符
CUDA C++编程指南(7.1)——C++语言扩展之函数执行空间指定符函数执行空间限定符用于指定函数是在主机上执行还是在设备上执行,以及是否可以从主机或设备调用。__global__执行空间说明符将函数声明为内核。此类函数具有以下特性:
云雾J视界1 个月前
服务器·人工智能·nvidia·算力·buck·dgx·交错并联
AI服务器供电革命:为何交错并联Buck成为算力时代的必然选择数据中心机房的低鸣,如今已演变为AI算力洪流的咆哮。根据Synergy Research Group的数据,2023年全球超大规模数据中心数量已突破900座,其中用于AI训练的算力集群正以每年超过50%的复合增长率膨胀。一个更具冲击力的事实是:单颗NVIDIA H100 GPU的峰值功耗已突破700瓦,而一个满载8颗H100的DGX服务器节点,瞬时功率需求可达6千瓦以上。这不仅仅是一个数字,它意味着供电网络必须在微秒级别内,稳定、高效地应对高达数千安培的电流瞬态变化。
403240731 个月前
linux·opencv·计算机视觉·nvidia·cuda·jetson
【2026最新】Jetson全系列安装支持CUDA加速的OpenCV 4.10保姆级教程(适配Jetpack 6/5及Orin/Xavier/Nano等)在 NVIDIA Jetson 边缘计算平台上(如 Jetson AGX Orin, Orin NX, Xavier NX, Nano 等),如果你设备的 OpenCV 不支持 CUDA 加速(仅 CPU 版本)。对于从事计算机视觉(CV)开发的工程师来说,无法利用 GPU 加速会极大地限制模型推理、图像预处理的效率。
REDcker1 个月前
架构·gpu·显卡·nvidia·cuda·英伟达·演进
Nvidia英伟达显卡型号发布史与架构演进详解英伟达显卡的发展史,核心主线是 GPU架构的迭代 与 GeForce产品线的演进。以下将按时间顺序,为您梳理两大主线的关键节点。
scott1985122 个月前
线性代数·矩阵·gpu·nvidia·cuda
NVIDIA GPU内部结构:高性能矩阵乘法内核剖析在这篇文章中,我们将逐步介绍支撑最先进的 NVIDIA GPU 矩阵乘法 (matmul) 内核的所有核心硬件概念和编程技术。
clorisqqq2 个月前
nvidia·黄仁勋·ces2026
黄仁勋 CES 2026 演讲笔记(part2 精华)主题主线:Agentic Enterprise AI(企业级智能体系统) → Physical AI(物理 AI) → 三台电脑范式(训练 / 推理 / 仿真) → 合成数据 → Cosmos 世界基础模型 → Alpamayo 推理式自动驾驶