ai infra

int WINGsssss13 天前
nccl·ai infra·集合通信库·我爱吃烤肉
NCCL工作流程分析&&NCCL源码解读本文章是笔者在学习NCCL源码时候的感悟和理解,由于源码实在抽象,所以笔者尽量用更直白通俗的语言表达自己的理解。若有错误,望各位大神多多批评指教!该文章会不断更新修改,一些细枝末节也将会不断补充,新的文章未来也会采用链接形式纳入本文章中。
superior tigre1 个月前
c++·cuda·ai infra
权威指南 第四章这一章主要是从memory角度来分析和优化算子的,用transposition的例子分析maxbandwidth rate对性能的影响。
强壮的派大星3 个月前
操作系统·ai infra
AI训练存储系统的架构选型演变:对象存储为后端的文件系统概论存储系统按照抽象级别分类,分为三种:文件存储、对象存储、块存储。此处我们不讨论块存储,只讨论文件存储与对象存储。
CCF ODC5 个月前
人工智能·开源·ai infra·ccf odtc·ccf开源发展技术委员会
CNCC 2025|开源AI基础设施论坛成功举办当前AI技术发展面临算力成本、工具链碎片化及严重依赖CUDA生态等核心挑战,该如何破局?10月25日,在CNCC 2025大会上,由CCF开源发展技术委员会AI Infra工作组发起的“开源AI基础设施论坛”成功举办。多位业内专家聚焦AI Infra开源进展,开源大模型训练和推理技术解析、大模型技术体系开源开放分级评估规范、GPU开源生态建设、云原生Infra Services等各个维度对AI开源基础设施现在、未来的进行了深度探讨。
我是有底线的