技术栈

密瓜智能

密瓜智能
17 天前
人工智能·kubernetes·开源·密瓜智能
从 Device Plugin 到 DRA:GPU 调度范式升级与 HAMi-DRA 实践KCD Beijing 2026 上,HAMi 社区核心贡献者分享了从 Device Plugin 到 DRA 的 GPU 调度范式升级。本文回顾了这次技术分享的核心内容,包括 DRA 的能力与挑战、HAMi-DRA 通过 Webhook 自动化 降低用户迁移成本的关键设计,以及性能与可观测性方面的实践成果。
密瓜智能
4 个月前
云原生·性能优化·开源·gpu算力·hami·密瓜智能
HAMi Meetup-贝壳找房 回顾:vGPU 推理集群的实践经验在大规模 AI 推理场景中,“算力不够”往往并非由硬件规模不足导致。贝壳找房(以下简称贝壳)在千卡级 GPU 集群规模下,整体 GPU 利用率约为 13%,主要问题来自小模型与多模型混跑场景下的显存碎片化以及整卡独占使用方式。
我是有底线的