gpu

怪怪王20 小时前
驱动开发·gpu·opengl
【GPU驱动】OpenGLES图形管线渲染机制OpenGL/ES 的渲染管线也是一个典型的图形流水线(Graphics Pipeline),包括多个阶段,每个阶段都负责对图形数据进行处理。管线的核心目标是将图形数据转换为最终的图像,这些图像可以显示在屏幕上。
叶庭云2 天前
pytorch·深度学习·gpu·empty_cache·内存缓存管理
PyTorch 深度学习框架中 torch.cuda.empty_cache() 的妙用与注意事项🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/在使用 PyTorch 进行深度学习模型训练与调优过程中,torch.cuda.empty_cache() 方法作为一种高效工具被广泛采用;但其正确应用要求充分理解该方法的功能及最佳实践。下文将对该方法的功能及最佳实践进行详细探讨:
smartcat20109 天前
大模型·gpu
VLLM历次会议(2024.7)支持LLama3.1:量化:vllm git下的子项目:llm-compressorCPU offloading
LucianaiB11 天前
python·ai·gpu·本地部署·deepseek
深度对比析:DeepSeek服务优胜本地部署、网页版与蓝耘GPU智算云平台的较量以及删除本地部署的过程🌟 嗨,我是LucianaiB!🌍 总有人间一两风,填我十万八千梦。🚀 路漫漫其修远兮,吾将上下而求索。
问道飞鱼11 天前
cpu·gpu·npu
【知识科普】CPU,GPN,NPU知识普及
Ronin-Lotus21 天前
嵌入式硬件·学习·cpu·gpu·tpu
嵌入式硬件篇---CPU&GPU&TPU以上就是今天要讲的内容,本文仅仅介绍了CPU、GPU、TPU。CPU,即Central Processing Unit,是计算机的核心组件,负责执行计算机程序中的指令,处理数据,控制硬件。以下是CPU的一些特点:
学习!!!25 天前
c++·gpu
Writing an Efficient Vulkan Renderer本文出自GPU Zen 2。Vulkan 是一个新的显式跨平台图形 API。它引入了许多新概念,即使是经验丰富的图形程序员也可能不熟悉。Vulkan 的主要目标是性能——然而,获得良好的性能需要深入了解这些概念及其高效应用方法,以及特定驱动程序实现的实现方式。本文将探讨内存分配、描述符集管理、命令缓冲区记录、管道障碍、渲染通道等主题,并讨论如何优化当前桌面/移动 Vulkan 渲染器的 CPU 和 GPU 性能,同时展望未来的 Vulkan 渲染器可以进行哪些不同的改进。
_Yhisken1 个月前
游戏·unity·性能优化·图形渲染·gpu
【读书笔记】万字浅析游戏场景中常见的渲染性能优化手段看标题大伙想必应该知道了这是个读书笔记,所以大佬看个乐就完了,主要还是新人用来做记录的,主要参考的是霜狼大佬的书《游戏场景开发与设计》,当然了,笔记肯定不是单纯照着抄一遍,那样没有任何意义,会加入我自己的理解和其它文章的所见所闻,这部分不敢保证全都准确,所以想获得无信息传播损失的一手资料的建议还是去看原书籍和参考部分原文。同时如果有错误敬请指出,另外性能优化是一个很高深的问题,牵扯到很多硬件架构上面的东西,且没有任何一个方法是万金油的,屡试不爽的,任何技术手段都有适用性,何况游戏项目千百万,找到合适的那一
Learning改变世界1 个月前
gpu
编译pytorch——cuda-toolkit-nvccCUDA(Compute Unified Device Architecture)是NVIDIA推出的一种并行计算平台和编程模型,允许开发者使用NVIDIA GPU(图形处理单元)进行通用计算任务。CUDA通过提供一系列的API和工具,使得开发者能够编写在GPU上高效运行的程序,从而显著提高计算密集型任务的性能。 CUDA的核心概念
Hi202402171 个月前
linux·opencv·arm·gpu·opencl·算力测试·mali-gpu
RK3588上CPU和GPU算力以及opencv resize的性能对比测试输出输出输出输出输出输出输出
smartcat20101 个月前
gpu
TensorRT-LLM中的MoE并行推理2种并行方式:moe_tp_size:按照维度切分,每个GPU拥有所有Expert的一部分权重。moe_ep_size: 按照Expert切分,每个GPU有用一部分Expert的所有权重。
知本知至1 个月前
linux·ubuntu·gpu
ubuntu18升级至ubuntu20机房有套老k8s集群,上面的比较重要的服务迁移走了。使用的是ubuntu18的系统,升级至ubuntu20再到ubuntu22,然后升级上面的k8s集群,方便后期维护
AI理性派思考者2 个月前
后端·github·gpu
【保姆教程】手把手教你在Linux系统搭建早期alpha项目cysic的验证者&证明者Cysic是ZK硬件加速平台,致力于设计先进的 ASIC 芯片,帮助缩短 ZK 证明生成时间,成为首个 ZK Prover Network。Cysic是一个实时的 ZK 证明生成和验证层,旨在以最快、最便宜、最简单、最去中心化的方式提供 ZK 证明。 Cysic 最近完成了 1200 万美元的 pre - A 轮融资,OKX Ventures 和 HashKey Capital 联合领投。加上去年 2 月种子轮融资600万美元,Polychain Capital 领投。目前共融资1800万美元。
gs801402 个月前
ubuntu·gpu·nvidia
ubuntu下 如何将 NVIDIA 内核驱动 升级到特定版本 如550.127要将 NVIDIA 内核驱动 升级到特定版本(例如 550.127),你需要按照以下步骤操作。这个过程通常涉及卸载现有的 NVIDIA 驱动程序并安装新版本的驱动程序。下面是一个逐步指南,适用于 Ubuntu 系统。
探索云原生2 个月前
ai·云原生·kubernetes·go·gpu
在 K8S 中创建 Pod 是如何使用到 GPU 的: nvidia device plugin 源码分析本文主要分析了在 K8s 中创建一个 Pod 并申请 GPU 资源,最终该 Pod 时怎么能够使用 GPU 的,具体的实现原理,以及 device plugin、nvidia-container-toolkit 相关源码分析。
凳子花❀2 个月前
ai·gpu
市场常见AI芯片总结产品概述SH1210芯片是一款高性能、低功耗的专业3D视觉AI芯片,内置了专用2D-ISP和3D-ISP(支持ToF和双目两种深度视觉),配备双核ARM A7以及双核超低功耗NPU,可提供2D/3D视觉处理和高速AI计算的能力,能够广泛用于智能门锁、智能门禁、金融支付、人身核验、智能机器人等各类2D/3D视觉终端。
扫地的小何尚2 个月前
人工智能·语言模型·自然语言处理·机器人·gpu·nvidia
什么是大型语言模型大型语言模型 (LLM) 是一种深度学习算法,可以使用非常大的数据集识别、总结、翻译、预测和生成内容。
驱动小百科2 个月前
电脑·cpu·gpu·npu·电脑硬件
NPU是什么?电脑NPU和CPU、GPU区别介绍随着人工智能技术的飞速发展,计算机硬件架构也在不断演进以适应日益复杂的AI应用场景。其中,NPU(Neural Processing Unit,神经网络处理器)作为一种专为深度学习和神经网络运算设计的新型处理器,正逐渐崭露头角。本文将深入探讨NPU的含义,以及它与传统处理器——CPU(Central Processing Unit,中央处理器)和GPU(Graphics Processing Unit,图形处理器)之间的显著区别。
self-motivation2 个月前
硬件架构·gpu·nvidia·tensor·cuda
gpu硬件架构NVIDIA在视觉计算和人工智能(AI)领域处于领先地位;其旗舰GPU已成为解决包括高性能计算和人工智能在内的各个领域复杂计算挑战所不可或缺的。虽然它们的规格经常被讨论,但很难掌握各种组件的清晰完整的图景。