【AI高性能网络解析】第一期:面向GPU算力纵向扩展的Scale-up网络技术研究摘要 Scale-up网络是算力资源纵向扩展网络,用于提供高带宽、低时延与高可靠的GPU互联网络,压缩GPU之间的通信开销,提高算力资源利用率。本文分析了Scale-up网络的技术要求,指出当前RoCE v2与PCIe都不能完全满足Scale-up网络的技术要求,需要从物理层、链路层及事务层等各个层面做优化。系统梳理了Scale-up网络国内外最新的标准化进展,并对未来Scale-up网络趋势做出预判。 关键词 智算网络;并行计算;纵向扩展;大模型;内存语义;计算-通信融合