nvidia

basketball61614 天前
人工智能·microsoft·nvidia·cuda
AI Infra 硬件体系与编程模型:17. CUDA编程基础:底层驱动 API 调用在CUDA开发的入门阶段,我们接触的几乎都是Runtime API(运行时API):cudaMalloc、cudaMemcpy、<<<>>>核函数启动……这些接口简单易用,几行代码就能跑起一个GPU程序。但很多人不知道,Runtime API 只是一层封装,它的底层是更基础、更灵活的 Driver API(驱动API)。
basketball61617 天前
人工智能·nvidia·cuda
AI Infra 硬件体系与编程模型:14. CUDA编程基础:事件与精确性能测量在之前的系列文章中,我们学习了CUDA的核函数、内存模型、共享内存优化和CUDA流技术。但所有这些优化都建立在一个前提之上:我们能够精确地测量程序的性能。
kyle~17 天前
人工智能·nvidia·cuda
推理部署---CUDA 执行模型(SM、Block、Warp 与 SIMT)CUDA(Compute Unified Device Architecture)是NVIDIA推出的通用并行计算平台和编程模型,其核心设计哲学是单指令多线程(Single-Instruction Multiple-Thread, SIMT),通过将计算任务分解为大量轻量级线程,利用GPU的大规模并行计算能力加速应用程序。
basketball61617 天前
人工智能·nvidia·cuda
AI Infra 硬件体系与编程模型:15. CUDA编程基础:混合精度计算在CUDA性能优化的进阶路径上,混合精度计算是一道必须跨过的门槛。从AI大模型训练到高性能科学计算,混合精度已经成为工业界的标准配置——它能在几乎不损失最终精度的前提下,将矩阵运算性能提升数倍,同时显存占用减半。
小白狮ww17 天前
人工智能·目标检测·计算机视觉·视觉检测·大语言模型·nvidia·locateanything
3B 参数,毫秒级响应:LocateAnything 如何重新定义开放世界目标检测来自 NVIDIA 的新作,LocateAnything-3B,主打视觉语言定位。说实话,看到「3B」这数字我第一反应:能有多能打?结果一看介绍,直接破防了。
kyle~19 天前
c++·机器人·nvidia·仿真·ros2
ROS 2 与 Isaac Sim 联合仿真(一)体系架构、环境选型与基础通信闭环ROS 2 与 NVIDIA Isaac Sim 的联合仿真,本质上是将机器人软件系统与高保真物理仿真平台解耦后重新闭环。Isaac Sim 负责构建真实感场景、机器人动力学、物理交互、传感器渲染与合成数据生成;ROS 2 负责承载通信中间件、导航、定位、运动规划、控制、日志、调试以及真实机器人软件栈。二者通过 Isaac Sim 的 ROS 2 Bridge 建立通信,使仿真环境能够像真实机器人一样向 ROS 2 发布 /clock、/tf、/joint_states、/odom、相机、LiDAR、IM
kyle~19 天前
机器人·nvidia·仿真·ros2
ROS 2 与 Isaac Sim 联合仿真(三):工程化部署、性能优化、多机器人与 Sim-to-Real完成 ROS 2 与 Isaac Sim 的基础通信、传感器发布和控制闭环后,真正的挑战会转向工程化部署。联合仿真系统要服务于算法验证、自动化测试、数据采集、性能评估、Sim-to-Real 和真实机器人上线,因此必须解决多机器人命名空间、DDS 通信、Launch 集成、容器化、Headless 运行、rosbag 记录、性能优化、仿真控制、批量实验和故障排查等问题。
CV-deeplearning19 天前
opencv·计算机视觉·pip·nvidia·cuda·gpu加速·cv-cuda
NVIDIA CV-CUDA:GPU 全流程加速计算机视觉,pip 一键安装替代 OpenCV,微软/腾讯/百度/字节全在用,云级图像处理吞吐量飙升 10 倍💡 还在用 CPU 版 OpenCV 做图像预处理?你的 GPU 在推理前白白闲置 80% 的时间!NVIDIA 联合字节跳动开源的 CV-CUDA,把图像解码、缩放、色彩转换、数据增强等全流程搬到 GPU,吞吐量飙升 10 倍+,延迟降低 90%。微软 Bing 视觉搜索、腾讯云音视频 PaaS、百度 AI 都在用。pip 一行安装,C++ 和 Python 双语言支持,Apache 2.0 开源,v0.16.0 最新版已支持 CUDA 13 和 Blackwell 架构。
OpenCSG24 天前
人工智能·大模型·nvidia·opencsg
Cosmos3:NVIDIA 把世界模型做成了“理解、生成、模拟、行动”的统一入口2026台北GTC大会期间,英伟达发布了Cosmos 3一款基于突破性Transformer混合架构的物理AI世界模型。Cosmos3 的关键不是生成更炫的视频,而是把文本、图像、视频、音频和动作轨迹放进同一个模型里,让 AI 能理解物理世界、预测未来状态,并生成可用于训练和评估的世界样本。
OpenBayes贝式计算1 个月前
计算机视觉·google·nvidia
端侧同尺寸 SOTA:OpenBMB 发布 1B 参数模型 MiniCPM5-1B;集成多级平行语料与多语言词典:SMOL 翻译数据集开源公共资源速递4 个公共数据集:SMOL 多语言翻译平行数据集DeepCrack 基础设施裂缝检测数据集
OpenBayes贝式计算1 个月前
计算机视觉·agent·nvidia
教程上新丨英伟达开源 LocateAnything,3B 模型可实现图像 + 视频的目标指向 / 开放词汇目标检测/指代表达定位 / OCR 文本定位等功能随着视觉语言模型(VLM)持续向 Agent、多模态交互和现实世界任务演进,「看懂图片」已经不再是终点,更重要的是「准确找到目标在哪里」。无论是开放词汇目标检测、GUI Agent 的界面操作、文档理解,还是机器人与自动驾驶系统中的环境感知,都对视觉定位(Visual Grounding)能力提出了越来越高的要求。
视***间1 个月前
人工智能·机器人·nvidia·机器狗·gpt-oss·视程空间·宇树机器人
算力筑基,智领人形机器人新时代 —— 英伟达 × 宇树科技携手推进具身智能,视程空间基于 NVIDIA 全栈算力产品助力机器人产业落地2026 年 6 月 1 日,台北 GTC 大会上,英伟达 CEO 黄仁勋正式官宣与宇树科技达成合作,联合推出 NVIDIA Isaac GR00T 人形机器人参考设计(H2+)。宇树科技提供 1.8 米 H2 人形机器人本体,英伟达提供 AI 计算平台、机器人基础大模型与仿真系统,以 “身体 + 大脑” 的组合,推动具身智能产业化发展。这一行业里程碑事件,进一步印证了 NVIDIA Jetson 算力平台在机器人领域的重要地位,也让行业更加清晰:机器人的智能化竞争,核心是边缘算力的竞争。
wangruofeng1 个月前
aigc·nvidia
NVIDIA RTX Spark 背后,联发科也坐上了主桌GTC 台北 2026 的舞台上,最容易被记住的画面,当然还是黄仁勋拿着 RTX Spark 讲“重新定义 PC”。
AI科技大本营1 个月前
nvidia·mediatek
MediaTek 与NVIDIA 合作推出 NVIDIA RTX Spark,驱动下一代 Windows PC 体验MediaTek 将其在 CPU性能、能效方面的技术实力注入突破性的NVIDIA RTX Spark ,在小巧且超高能效的Windows PC 中,将本地个人智能体、专业内容创作和游戏融为一体。
阿里云大数据AI技术1 个月前
人工智能·agent·nvidia
基于阿里云 DataWorks Data Agent 进行大模型热度分析在全局 AI 模型呈现爆发式增长的背景下,高效洞察技术趋势已成为开发者和企业决策的关键。以全球最大的 AI 模型托管平台之一 Hugging Face 为例,其公开模型数量已突破 200 万。面对如此庞大且高频更新的数据,如何快速提取出高价值的模型热度、任务分布及社区关注度变化,对传统的数据开发方案提出了挑战。
Together_CZ1 个月前
virtualenv·nvidia·cuda·cudnn·rtx 5060
Windows 下 CUDA / cuDNN / PyTorch GPU 训练环境搭建完整指南:虚拟环境与系统级环境两种方案Windows 下 CUDA / cuDNN / PyTorch GPU 训练环境搭建完整指南:虚拟环境与系统级环境两种方案
元让_vincent1 个月前
nvidia·视觉slam·gpu加速
论文Review SLAM cuVSLAM | NVIDIA 2025 | CUDA加速的视觉里程计与建图系统题目: cuVSLAM: CUDA accelerated visual odometry and mapping 作者: Alexander Korovko, Dmitry Slepichev, Alexander Efitorov, Aigul Dzhumamuratova, Viktor Kuznetsov, Hesam Rabeti, Joydeep Biswas, Soha Pouya 机构: NVIDIA 论文版本: arXiv:2506.04359v3,2025 年 7 月修订版 (arXi
AI小小怪1 个月前
linux·nvidia·cuda
保姆级教程:Ubuntu 22.04 安装 NVIDIA GPU 驱动 + CUDA 12.6(RTX 3080 显卡)本文记录了一次从驱动损坏到成功安装的全过程,包含清理、编译问题解决、全局环境配置等完整步骤,适用于多卡服务器场景。
feasibility.1 个月前
linux·运维·服务器·经验分享·nvidia·驱动
nvidia-smi 失灵,显存凭空消失?—— NVML 驱动版本错配的记录第二天回到工位,准备查看昨晚的运行结果。nvidia-smi 直接抛出版本不匹配:Failed to initialize NVML: Driver/library version mismatchNVML library version: 580.159