英伟达

OAK中国_官方15 天前
计算机视觉·云计算·深度相机·英伟达
如何选择合适的视觉系统: 云端 VS 边缘构建计算机视觉系统往往需要做出关键决策:数据应在云端处理还是边缘端处理?不同部署方案在成本、复杂度、延迟和可扩展性方面存在显著差异。这份指南对比了三种常见的视觉系统架构,覆盖从简单监控到复杂机器人技术等多类应用场景。我们的目标是帮助您理解各种方案的取舍权重并选择合适架构,同时展示一体化方案OAK 4 D(RVC4)为何通常成为稳健的边缘部署中最简单且最具成本效益的选择。
俊哥V16 天前
人工智能·英伟达
[本周深度看点]英伟达与物理 AI 的“ChatGPT 时刻”——从虚拟认知到物理世界理解的技术跃迁(本文借助 DeepSeek / ChatGPT 辅助整理)自生成式大模型(GPT、Gemini、Claude 等)在文本和图像处理领域取得突破以来,AI 的应用场景正迅速向物理世界的感知与操作延伸。在 CES 2026 上,英伟达 CEO 黄仁勋提出“Physical AI”概念,称这是机器人领域的“ChatGPT 时刻”。这一概念标志着 AI 从信息空间认知向物理世界理解与执行能力的关键跨越。
REDcker18 天前
架构·gpu·显卡·nvidia·cuda·英伟达·演进
Nvidia英伟达显卡型号发布史与架构演进详解英伟达显卡的发展史,核心主线是 GPU架构的迭代 与 GeForce产品线的演进。以下将按时间顺序,为您梳理两大主线的关键节点。
纪伊路上盛名在22 天前
pytorch·深度学习·torch·cuda·英伟达
如何为我们的GPU设备选择合适的CUDA版本和Torch版本?可以查看官网(https://pytorch.org/get-started/previous-versions/),比如说
TechTrek2 个月前
英伟达·deepseek·cuda 13.1·lightx2v
英伟达推出CUDA 13.1版本,DeepSeek V3到V3.2技术演进全解析1. 英伟达发布革命性CUDA Tile模型,Python代码性能匹敌C++ 英伟达推出CUDA 13.1版本,引入全新的CUDA Tile编程模型,允许开发者用15行Python代码实现GPU内核编程,性能可媲美200行手动优化的CUDA C++代码。这一变革将GPU编程从传统的线程级管理提升至瓦片(Tile)级抽象,大幅降低开发门槛,但也被行业质疑可能削弱CUDA的生态壁垒,因为Tile模型更易移植到其他硬件平台。此次更新重点支持Blackwell架构,未来将扩展至更多GPU代际。 博客: https
HyperAI超神经5 个月前
机器人·大语言模型·视觉语言模型·英伟达·physical ai·实时智能交互·gpu 架构
售价3499美元,英伟达Jetson Thor实现机器人与物理世界的实时智能交互黄仁勋曾公开表示,机器人是英伟达在人工智能之外的最大增长机会。在 2025 年 1 月初开幕的 CES 2025 上,老黄更是高喊「AI 的下一个前沿是物理」,就像当年押注 OpenAI 一般,他如今的选择是 Physical AI 引领的机器人赛道。
荔枝吻5 个月前
nvidia·英伟达
【沉浸式解决问题】NVIDIA 显示设置不可用。 您当前未使用连接到NVIDIA GPU 的显示器。在看一篇cuda安装的教程时,第一步是打开NVIDIA 控制面板,但是我打不开:NVIDIA 显示设置不可用。 您当前未使用连接到NVIDIA GPU 的显示器。
想要成为计算机高手7 个月前
人工智能·python·机器人·英伟达·模拟器·仿真环境
6.isaac sim4.2 教程-Core API-多机器人,多任务本教程将两种不同类型的机器人集成到同一个仿真中。它详细说明了如何构建程序逻辑以在子任务之间切换。通过本教程,你将获得构建更复杂的机器人交互仿真经验。
想要成为计算机高手7 个月前
人工智能·python·机器人·英伟达·isaac sim·仿真环境
4. isaac sim4.2 教程-Core API-Hello robot本教程详细介绍了如何在 Omniverse Isaac Sim 的扩展应用中添加并移动一个移动机器人。完成本教程后,您将了解如何向仿真环境中添加机器人,并使用 Python 对其轮子施加动作。
CJ点7 个月前
ffmpeg·显卡·合并·amd·英伟达·裁剪
FFmpeg命令全解析:三步完成视频合并、精准裁剪、英伟达显卡加速根据时长裁剪,常规的裁剪 -c copy 表示直接复制流(不重新编码),速度极快,但要求切割时间必须是关键帧。否则裁剪下来的画面开头/结尾 会模糊花屏
TGITCIC8 个月前
人工智能·大模型·llama·英伟达·大模型速度·ai赛道·大模型基座
英伟达破局1000 Token/秒!Llama 4以光速重塑AI推理边界当用户还在惊叹AI生成文字的速度时,英伟达已用一场“秒速千token”的技术突破,将行业推向新维度。Llama 4 Maverick模型在单节点(8颗Blackwell GPU)上实现每秒1000 token的生成速度,这一数字不仅超越了前代Blackwell的基线表现,更让单台服务器(72颗GPU)的吞吐量飙升至72,000 TPS。这个速度意味着,若将每秒1000 token换算为文字,相当于每秒输出约200字——足够在1分钟内生成《蒙娜丽莎》全篇描述,或是实时处理数百个用户的对话请求。
未来智慧谷8 个月前
人工智能·microsoft·英伟达
微软 Build 2025:开启 AI 智能体时代的产业革命在 2025 年 5 月 19 日的微软 Build 开发者大会上,萨提亚・纳德拉以 "我们已进入 AI 智能体时代" 的宣言,正式拉开了人工智能发展的新纪元。这场汇聚了奥特曼、黄仁勋、马斯克三位科技领袖的盛会,不仅发布了 50 余项创新产品,更通过 "开放智能体网络" 的战略布局,重新定义了人类与技术的交互范式。
deephub10 个月前
人工智能·pytorch·python·深度学习·英伟达
PyTorch CUDA内存管理优化:深度理解GPU资源分配与缓存机制在深度学习工程实践中,当训练大型模型或处理大规模数据集时,上述错误信息对许多开发者而言已不陌生。这是众所周知的
林泽毅10 个月前
python·深度学习·昇腾·英伟达·swanlab·寒武纪·训练实战
SwanLab硬件监控:英伟达、昇腾、寒武纪SwanLab在跟踪实验的过程中,会自动监控机器的硬件资源情况,并记录到 「系统」图表 当中。目前SwanLab已支持监控3款AI计算芯片(华为昇腾、英伟达、寒武纪)的硬件资源情况,涵盖显卡利用率、显存占用率、显卡温度、显卡功率等指标。
放羊郎10 个月前
网络·nvidia·英伟达·游戏显卡·rtx
英伟达消费级RTX显卡配置表
JiaWen技术圈1 年前
人工智能·华为·gpu算力·英伟达
HuaWei、NVIDIA 数据中心 AI 算力对比Ascend 910B 是 HuaWei 于 2023 年推出的高性能 AI 处理器芯片,其对标产品为 Nvidia A100/A800,其算力表现如下:
MemVerge1 年前
科技·gpu·cxl·英伟达
MemVerge与美光科技利用CXL®内存提升NVIDIA GPU利用率该联合解决方案将 GPU 利用率提高了 77%,并将 OPT-66B 批量推理的速度提高了一倍以上。2023 年 3 月 18 日,作为大内存软件领域领导者的 MemVerge,与美光科技联手推出了一项突破性解决方案,该方案通过智能分层的 CXL 内存,提升了大型语言模型(LLMs)的性能,通过从 GPU HBM 卸载到 CXL 内存。这一创新合作正在 GTC 展会的美光展位 #1030 展出,与会者可以亲身体验分层内存对 AI 工作负载的变革性影响。
扫地的小何尚1 年前
人工智能·aigc·llama·gpu·nvidia·cuda·英伟达
NVIDIA RTX 系统上使用 llama.cpp 加速 LLM适用于 Windows PC 的 NVIDIA RTX AI 平台提供了一个蓬勃发展的生态系统,其中包含数千种开源模型,供应用程序开发人员利用并集成到 Windows 应用程序中。值得注意的是,llama.cpp 是一款流行的工具,在撰写本文时拥有超过 65,000 个 GitHub 星标。这个开源存储库最初于 2023 年发布,是一个轻量级、高效的大型语言模型 (LLM) 推理框架,可在包括 RTX PC 在内的一系列硬件平台上运行。
神州问学1 年前
人工智能·芯片·英伟达
英伟达 GPU 架构:演进与模型推理速度的深度关联英伟达的 GPU 架构演进之路充满了创新与突破。©作者|Zane来源|神州问学一、 英伟达GPU的架构演进之路
江小皮不皮1 年前
人工智能·深度学习·chatgpt·llm·transformer·英伟达·ngpt
NGPT:在超球面上进行表示学习的归一化 Transformer在人工智能领域,神经网络架构的创新不断推动着技术的进步。最近,一篇名为 “NGPT: NORMALIZED TRANSFORMER WITH REPRESENTATION LEARNING ON THE HYPERSPHERE” 的研究论文引起了广泛关注。作者是 Ilya Loshchilov、Cheng - Ping Hsieh、Simeng Sun 和 Boris Ginsburg,他们来自 NVIDIA。这篇论文提出了一种新颖的神经网络架构 —— 归一化 Transformer(nGPT),它在超球