英伟达

MemVerge1 个月前
科技·gpu·cxl·英伟达
MemVerge与美光科技利用CXL®内存提升NVIDIA GPU利用率该联合解决方案将 GPU 利用率提高了 77%,并将 OPT-66B 批量推理的速度提高了一倍以上。2023 年 3 月 18 日,作为大内存软件领域领导者的 MemVerge,与美光科技联手推出了一项突破性解决方案,该方案通过智能分层的 CXL 内存,提升了大型语言模型(LLMs)的性能,通过从 GPU HBM 卸载到 CXL 内存。这一创新合作正在 GTC 展会的美光展位 #1030 展出,与会者可以亲身体验分层内存对 AI 工作负载的变革性影响。
扫地的小何尚1 个月前
人工智能·aigc·llama·gpu·nvidia·cuda·英伟达
NVIDIA RTX 系统上使用 llama.cpp 加速 LLM适用于 Windows PC 的 NVIDIA RTX AI 平台提供了一个蓬勃发展的生态系统,其中包含数千种开源模型,供应用程序开发人员利用并集成到 Windows 应用程序中。值得注意的是,llama.cpp 是一款流行的工具,在撰写本文时拥有超过 65,000 个 GitHub 星标。这个开源存储库最初于 2023 年发布,是一个轻量级、高效的大型语言模型 (LLM) 推理框架,可在包括 RTX PC 在内的一系列硬件平台上运行。
神州问学2 个月前
人工智能·芯片·英伟达
英伟达 GPU 架构:演进与模型推理速度的深度关联英伟达的 GPU 架构演进之路充满了创新与突破。©作者|Zane来源|神州问学一、 英伟达GPU的架构演进之路
江小皮不皮2 个月前
人工智能·深度学习·chatgpt·llm·transformer·英伟达·ngpt
NGPT:在超球面上进行表示学习的归一化 Transformer在人工智能领域,神经网络架构的创新不断推动着技术的进步。最近,一篇名为 “NGPT: NORMALIZED TRANSFORMER WITH REPRESENTATION LEARNING ON THE HYPERSPHERE” 的研究论文引起了广泛关注。作者是 Ilya Loshchilov、Cheng - Ping Hsieh、Simeng Sun 和 Boris Ginsburg,他们来自 NVIDIA。这篇论文提出了一种新颖的神经网络架构 —— 归一化 Transformer(nGPT),它在超球
yutianzuijin4 个月前
gpu算力·算力·高通·苹果·英伟达·int8
常见的GPU性能对比写这篇博客的目的就是想搞清楚英伟达不同显卡之间的性能差异以及移动端GPU的性能达到了英伟达显卡的哪一代,让自己也让大家明白不同显卡的算力差异。所有的数据均从网络搜索,有不正确的地方欢迎批评指正。同一显卡会有一个首次发布,此外还有一系列的迭代升级版本,我们只考虑首次发布版本的性能。鉴于现在的模型推理大多使用int8来进行推理,所以大家可以着重看一下int8算力那一列。
粥粥粥少女的拧发条鸟5 个月前
开源·gpu算力·英伟达
NVIDIA 完全过渡到开源 GPU 内核模块当时,NVIDIA宣布后续版本将提供更强大、功能更齐全的 GeForce 和 Workstation Linux 支持,NVIDIA 开放内核模块最终将取代闭源驱动程序。
HermanYe9966 个月前
机器人·仿真·传感器·英伟达·isaac sim
Nvidia Isaac Sim组装机器人和添加传感器 入门教程 2024(5)25 mins在Isaac Sim中组装一个带传感器的机器人需要一些基本的步骤:在本章节中,我们将学习如何组装最简单的一个两轮差速机器人,下图中的机器人可以视作由三个杆件(links)和两个转动关节(revolute joints)组成的。
HermanYe9966 个月前
人工智能·机器人·仿真·英伟达·isaac sim
Nvidia Isaac Sim搭建仿真环境 入门教程 2024(4)50 mins在进行机器人仿真时,搭建一个相对真实的仿真环境是很重要的。一个完整的仿真环境不仅能提高仿真的精确度,还能提供更为直观的可视化效果。 接下来,我们将讨论如何创建这样一个场景。
智能相对论6 个月前
al·英伟达·moe模型
英伟达“超神”的背后:AI厂商迫切地在MoE模型上寻求算力新解法文 | 智能相对论作者 | 陈泊丞在过去的一年多时间内,英伟达破天荒地完成了市值的“三级跳”。一年前,英伟达的市值并尚不足1万亿美元,位居谷歌母公司Alphabet、亚马逊、苹果和微软等科技巨头之后。
喜好儿aigc7 个月前
游戏·电脑·copilot·nvidia·英伟达
COMPUTEX 2024 国际电脑展即将举行,英伟达宣布将Copilot+引入RTX系列设备,赋能游戏本AI助理COMPUTEX 2024 国际电脑展即将于2024年6月4日至7日在台北南港展览馆1馆及2馆盛大举行。作为业界瞩目的盛会,本次展会不仅吸引了全球各地的科技爱好者,更迎来了AMD CEO苏姿丰博士和NVIDIA首席执行官黄仁勋的精彩演讲。
richerg859 个月前
nvidia·黄仁勋·英伟达
黄仁勋:我们需要更大的GPU……一个非常非常大的GPU!在暖场环节,一段命名为“活的艺术(Living Art)”的视频让全场鸦雀无声,在AI生成的实时数据雕塑面前,整个硅谷都在屏息以待,直到穿着皮夹克的英伟达创始人&CEO黄仁勋走上Keynote的舞台。
HyperAI超神经9 个月前
大模型·gpu·芯片·黄仁勋·英伟达·gtc·ai4s
英伟达黄仁勋发布GB200,比H100推理能力提高30倍,能耗降低25倍,将AI4S能力做成微服务「AI 的 iPhone 时刻已经到来。」黄仁勋在英伟达 GTC 2023 上的金句言犹在耳,这一年,AI 的发展也印证了其所言非虚。
yuzhangfeng1 年前
华为·gpu·英伟达·910b
【GPU性能】英伟达 vs海思:GPU性能一览一句话总结,H100 vs. A100:3 倍性能,2 倍价格值得注意的是,HCCS vs. NVLINK的GPU 间带宽。
日晨难再1 年前
架构·显卡·英伟达
英伟达显卡系列与架构、代表产品1、GeForce系列:GeForce系列是NVIDIA最主要的消费者显卡系列,用于游戏和娱乐。包括不同性能水平的产品,从入门级到高端。
简简单单OnlineZuozuo1 年前
人工智能·黄仁勋·英伟达
黄仁勋:英伟达预言 2 年内行业将面目全非 一个词形容AI:Unbelievable本心、输入输出、结果编辑:简简单单 Online zuozuo 地址:https://blog.csdn.net/qq_15071263