gpu

爱学习的大牛1233 天前
学习·架构·gpu
GPU架构学习图形处理单元(Graphics Processing Unit,GPU)自诞生以来,已从专注于图形渲染的专用硬件演变为支撑现代计算科学、人工智能、科学仿真乃至区块链等多元领域的通用并行计算引擎。其核心架构设计理念——以大规模并行性换取高吞吐量——与传统中央处理单元(CPU)的低延迟串行执行路线形成了鲜明对比。本文将系统、深入地剖析GPU的架构演进历程、核心组成部件、内存层次结构、执行模型、调度机制以及现代GPU在AI与高性能计算(HPC)领域的前沿扩展,旨在为读者提供一份兼具理论深度与工程实践价值的综合性
virtaitech3 天前
人工智能·科技·ai·gpu·池化技术
趋动科技 OrionX 社区版永久免费:重塑 AI 算力格局的“胜负手”嘿,朋友,我知道你现在面临什么。看着GPU利用率监控,那条线永远在20%-30%徘徊。价值几十万的硬件,大部分时间都在“睡大觉”。
专注VB编程开发20年5 天前
算法·gpu
C#,VB.NET GPU计算和调试c# OpenCL可以直接以源码形式调试吗?估计不行吧,要是可以事件方式返回结果,或者把结果写入C#的几个地址,通过监控主线程的一些内存或对象的地址,查看GPU运行进度和计算结果
love530love12 天前
人工智能·windows·gpu·cuda·ollama·lm studio·openclaw
【OpenClaw 本地实战 Ep.2】零代码对接:使用交互式向导快速连接本地 LM Studio 用 CUDA GPU 推理目标:让 OpenClaw 调用本地 LM Studio 运行的模型,代替 Ollama 实现稳定的 CUDA GPU 推理,体验极速的本地模型服务 部署方式:从源代码部署(非 npm 全局安装) 环境:Windows + WSL2(推荐)或原生 Windows 版本:OpenClaw 2026.2.13 (a2b45e1)
Eloudy13 天前
机器学习·gpu·cuda
CUTLASS README v4.4.0CUTLASS 4.4.0 - 2026年1月CUTLASS 是一套在 CUDA 中所有层次和规模上实现高性能矩阵乘法(GEMM)及相关计算的抽象集合。它融合了分层分解和数据移动的策略。CUTLASS 将这些“可动部件”分解为可重用、模块化的软件组件和抽象。
RainbowC016 天前
gpu
总结各GPU的OpenCL子组洗牌支持情况子组(Sub-group)自 OpenCL 2.0 正式引入,是工作组(Work-group)内部更小的执行单位,通常直接映射到 GPU 的 SIMD/SIMT 执行单元(如 Nvidia Warp 和 AMD Wavefront),具有更好的数据共享与同步能力。
70asunflower17 天前
gpu·就业·岗位
算子开发到底在做什么?“算子开发(Operator Kernel Development)”在真实工业环境里,绝对不只是“写一个 conv 的实现”,而是:
迎仔19 天前
gpu
B-基础:GPU驱动基础概念GPU(图形处理器)就像一个超级厨师,专门负责处理复杂的计算任务。而GPU驱动就是这个厨师的工作手册,告诉厨师如何使用厨房里的各种设备,如何高效地完成烹饪任务。在算力中心,GPU驱动的重要性不言而喻,它直接影响着AI训练和推理的效率。
迎仔19 天前
gpu·gpu驱动
F-排查:GPU驱动故障排查手册在算力中心的日常运维中,GPU驱动故障是不可避免的。就像人生病需要医生诊断一样,GPU驱动故障也需要系统化的排查方法。本手册将为你提供一套完整的GPU驱动故障排查流程和方法,帮助你快速定位和解决问题。
迎仔19 天前
gpu·gpu驱动
D-安装:GPU驱动安装与升级最佳实践在算力中心的运维中,GPU驱动的安装与升级是一项基础但关键的工作。就像我们日常生活中安装和更新手机应用一样,正确的安装和升级方法可以确保GPU驱动的稳定性和性能。本章节将为你提供一份GPU驱动的"安装指南",帮助你掌握最佳实践。
迎仔19 天前
运维·gpu·gpu驱动
E-自动化:GPU驱动维护自动化在现代算力中心,自动化已经成为提高运维效率、减少人为错误的关键手段。GPU驱动的维护也不例外,通过自动化工具和流程,我们可以实现驱动的自动监控、更新、部署和告警,将运维人员从重复性工作中解放出来,专注于更有价值的任务。
小白狮ww21 天前
人工智能·深度学习·机器学习·ocr·cpu·gpu·deepseek
要给 OCR 装个脑子吗?DeepSeek-OCR 2 让文档不再只是扫描如何形容现在市面上普遍的 OCR 呢?可能你已经习惯了它的「固执」——无论文档布局多复杂,它总是老老实实从左到右、从上到下扫一遍。遇到双栏论文还好,碰上跨页表格或者公式脚注混排,输出结果往往乱得让人头疼。这不是识别不准,而是理解方式出了问题。
小白狮ww1 个月前
人工智能·深度学习·目标检测·机器学习·cpu·gpu·视觉分割模型
Ovis-Image:卓越的图像生成模型你是否还在为无法得到自己心中想要的画面发愁?直到现在 ai 生成的图片也会有很多槽点,比如文字乱码想在 T 恤上印「LOVE」,结果出来的是 ℒℴ𝒱 外星文,放大一看全是伪笔画,又或者是常识错误,猫耳朵长到头顶正中间,汽车轮子比车身还大,咖啡杯没有底,物理老师沉默,生物老师落泪,除了这些还有风格漂移,乱打光影甚至多写几句,它又自动忽略后半截,像跟健忘症患者对话。
virtaitech1 个月前
人工智能·科技·ai·ocr·gpu·算力
云平台一键部署【rednote-hilab/dots.ocr】多语言文档布局解析模型dots.ocr 是一个强大的多语言文档解析器,它在一个单一的视觉-语言模型中统一了布局检测和内容识别,同时保持良好的阅读顺序。尽管其基础是紧凑的1.7B参数的大规模语言模型,但它达到了最先进的(SOTA)性能。
virtaitech1 个月前
人工智能·科技·ai·免费·gpu·池化技术
如何评价趋动科技推出永久免费的OrionX社区版?一句话总结:OrionX社区版是一款专为中小企业、开发者及科研团队打造的GPU池化工具,以“零成本接入,企业级体验”为核心优势,打破算力资源管理壁垒,让轻量化团队也能高效掌控GPU算力。
virtaitech1 个月前
人工智能·深度学习·机器学习·ai·gpu·算力·云平台
云平台一键部署【Tencent-YouTu-Research/Youtu-LLM-2B】具备原生智能体能力Youtu-LLM 是一款全新、小巧但功能强大的大语言模型(LLM),仅包含 19.6 亿参数,支持 128k 长上下文,并具备原生的智能体(agentic)能力。在通用评估中,Youtu-LLM 在常识推理、STEM、编程和长上下文处理等方面显著优于同规模的当前最先进(SOTA)LLM;在智能体相关测试中,Youtu-LLM 甚至超越了更大规模的领先模型,真正能够完成多种端到端的智能体任务。
hahahahanhanhan1 个月前
人工智能·python·tensorflow·gpu
Tensorflow使用GPU(cuda和cudnn和tensorflow下载)提供一个比较简单的方法安装:不需要去那些网站下载cuda和cudnn,当然如果要升级系统cuda版本,还是需要重新安装的,升级可以看之前的文章
InfraTech1 个月前
gpu
虚拟GPU MIG原理与实践详解本文作者:kaiyuan虚拟GPU MIG原理与实践详解MIG(Multi-Instance GPU)作为Ampere架构开始支持的特性,解决了GPU在集群服务应用时一类需求:GPU切分与虚拟化。本文主要是介绍MIG相关的概念与使用方法,通过实际操作带读者了解该特性的基本情况。
scott1985121 个月前
gpu
智驾芯片算力比较 Horizon J6 VS Nvidia orinSummary Table: Journey 6 (Flagship/P) vs. Orin-XOEM / Tier 1
缘友一世1 个月前
bug·gpu·硬件·主板·x99
精粤X99-TI D4 PLUS大板使用多显卡BIOS设置