技术栈
roce
杰克逊的日记
13 天前
运维
·
服务器
·
网络
·
roce
什么是RoCE网络技术
RoCE(RDMA over Converged Ethernet) 是一种基于以太网的远程直接内存访问(RDMA)技术,旨在通过标准以太网基础设施实现低延迟、高带宽的数据传输。它将 RDMA 的高效数据传输能力与以太网的兼容性结合,主要用于数据中心高性能计算(HPC)、云计算和大规模存储集群等场景。
星融元asterfusion
1 年前
网络
·
交换机
·
roce
·
rocev2
·
easy roce
Easy RoCE:在SONiC交换机上一键启用无损以太网
RDMA(远程直接内存访问)技术是一种绕过 CPU 或操作系统,在计算机之间直接传输内存数据的技术。它释放了内存带宽和 CPU,使节点之间的通信具有更低的延迟和更高的吞吐量。目前,RDMA 技术已广泛应用于高性能计算、人工智能工作负载、存储和许多其他场景。
Pretend ^^
1 年前
网络
·
分布式
·
深度学习
·
nccl
·
ib
·
roce
2. 多机多卡运行nccl-tests对比分析
NCCL(NVIDIA Collective Communications Library)是NVIDIA提供的一套用于GPU加速的通信库,主要用于在多个GPU之间进行数据传输和通信。它被设计为在异构计算环境中(包括NVIDIA GPU和CPU)高效地执行数据并行和模型并行。