rdma

tiantianuser2 天前
fpga开发·rdma·高速传输·cmac·roce v2
RDMA设计53:构建RoCE v2 高速数据传输系统板级测试平台2完成 HDL 工程及 Block Design 设计后,进行综合与实现, RoCE v2 高速数据传输系统的资源占用如表1 所示。从资源占用表中可以看出,基于本IP实现的 RoCE v2高速数据传输系统资源占用率低,更容易被集成到实际应用环境中。
tiantianuser2 天前
网络·fpga开发·rdma·高速传输·cmac·roce v2
RDMA设计50: 如何验证网络嗅探功能?网络嗅探的主要功能包括 ARP 接收发送及 ICMP 接收发送,RDMA技术允许主机直接访问远程主机的内存,无需CPU介入,因此其流量不经过操作系统内核协议栈。这种设计提升了性能,但也使得嗅探变得复杂:
tiantianuser2 天前
fpga开发·rdma·高速传输·cmac·roce v2
RDMA设计52:构建RoCE v2 高速数据传输系统板级测试平台前面分享如何进行仿真,下面介绍硬件平台上验证其功能及性能。 RoCE v2 高速数据传输系统基于Xilinx integrated 100G Ethernet Subsystem 进行搭建,其常用版本为 UltraScale+ CMAC集成块,考虑低成本方案,这里使用基于 XCZU47DR FPGA 的开发板进行硬件平台搭建及测试。远程主机端则使用 迈洛斯(现英伟达) CX455-A 网卡,其支持 100Gbps IB/ETH 网络数据传输。
星融元asterfusion3 天前
运维·rdma·会话追踪
打破“黑盒”:RoCE小工具为RDMA网络运维带来可视化曙光随着 AI 训练、推理及 NVMe-oF 存储等业务的爆发式增长,基于 RoCEv2 的 RDMA 网络已成为现代数据中心的核心基础设施 。然而,性能与运维难度往往成正比。长期以来,RDMA 通信在网络中如同处于一个“黑盒”状态,业务侧工程师难以获悉真实的转发路径 。
业余程序员plus7 天前
rdma·infiniband·bth·psn·fecn·becn·rdma语义
RDMA-InfiniBand基本传输头BTH分析(三)IBA传输层的基本传输头(Base Transport Header)定义了InfiniBand的事务类型,同时也实现了报文确认与重传功能,是IBA协议的核心部分。RoCE、RoCEv2、veRoCE、iWARP等RDMA改进协议,都是通过保留BTH来兼容RDMA协议。
业余程序员plus11 天前
rdma·infiniband·lrh·bth·rdeth·reth·atomiceth
RDMA-InfiniBand包格式分析(二)包(Packets)是IBA(InfiniBand Architecture)网络传输的最小单元。消息(Message,即数据)被分割成可以传输的段,然后组装成包,接着发送到IBA网络上,经过路由,最终到达目的地。数据包有如下的特性:
业余程序员plus12 天前
rdma·qp·infiniband·roce·wqe·cqe·iba
RDMA-InfiniBand总线架构简介(一)IBA(InfiniBand Architecture)定义了一种系统区域网络(System Area Network,SAN),用于连接多个独立的处理器平台(即主机处理器节点)、I/O平台及I/O设备。IBA SAN是一种通信与管理基础设施,可为一个或多个计算机系统同时支持I/O和处理器间通信(IPC)。一个IBA系统的规模可小至仅含单个处理器和少量I/O设备的小型服务器,也可大至包含数百个处理器和数千个I/O设备的大规模并行超级计算机集群。此外,IBA架构对IP协议很友好,使其能够桥接到互联网、内联网
三点水-here13 天前
分布式·rdma·nccl·moe·流水线并行·张量并行·专家并行
04 - 分布式大模型推理实战:TP/PP/EP并行策略深度解析本文是《大模型推理框架深度解析》系列的第四篇,详解张量并行、流水线并行与专家并行的原理与配置。当你的模型从7B扩展到70B、405B,单卡显存已经无法满足需求时,分布式推理成为必然选择。但面对TP、PP、EP等各种并行策略,很多开发者感到困惑:
tiantianuser1 个月前
fpga开发·rdma·高速传输·cmac·roce v2
RDMA设计37:RoCE v2 子系统模型设计本博文主要交流设计思路,在本博客已给出相关博文160多篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。
yusur1 个月前
人工智能·科技·rdma·dpu
边缘智算新引擎 DPU 驱动的算力革新2026年1月7日,工信部印发《工业互联网和人工智能融合赋能行动方案》,强化工业智能算力供给。加快工业互联网与通算中心、智算中心、超算中心融合应用,鼓励公共算力服务商向工业企业提供服务。引导工业企业加快边缘一体机、智能网关等设备部署。鼓励工业企业、设备供应商联合推动端侧设备智能化升级,在生产设备、传感器、无人运输车辆(AGV)等部署轻量化算力模块,提升数据实时处理能力。加快构建全国一体化算力网络,推动智算云服务试点在工业领域中应用推广,强化工业大模型在算力跨区域高效调用、“云边端”算力精准匹配等方面普及应
bandaoyu1 个月前
rdma
【RDMA】infiniband IB 流控机制InfiniBand通过链路层流控与QoS机制,确保了数据的“零丢包”可靠传输。流量控制:平衡数据传输速率,避免多数据同时发送收端缓冲区溢出。
bandaoyu1 个月前
rdma
【RDMA】infinband诊断工具rpm包:infiniband-diags命令集合:/usr/sbin/check_lft_balance.pl
tiantianuser1 个月前
fpga开发·rdma·高速传输·cmac·roce v2
RDMA设计33:RoCE v2 接收模块本博文主要交流设计思路,在本博客已给出相关博文约160篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。
tiantianuser1 个月前
fpga开发·rdma·cmac·roce v2
RDMA设计31:RoCE v2 发送模块3本博文主要交流设计思路,在本博客已给出相关博文约150篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。
tiantianuser1 个月前
服务器·fpga开发·rdma·fpga设计·高速传输
RDMA设计29:RoCE v2 发送及接收模块设计2本博文主要交流设计思路,在本博客已给出相关博文约150篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。
xixixi777772 个月前
服务器·网络·php·内存·数据中心·数据传输·rdma
RDMA(远程直接内存访问——允许外部设备直接访问主机的主存,绕过CPU,从而提高数据传输效率RDMA是一项改变数据中心内部通信规则的革命性网络技术。它的核心思想是允许一台计算机直接访问另一台计算机的内存,而无需经过对方操作系统内核的介入,从而在硬件层面实现极低延迟和极高吞吐的数据传输。
tiantianuser2 个月前
nvme·rdma·fpga设计·高速传输·nvme-of
RDMA设计19:RoCE v2 发送及接收模块设计本博文主要交流设计思路,在本博客已给出相关博文约150篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。若有NVME或RDMA 产品及项目需求,请看B站视频后联系。
tiantianuser2 个月前
网络协议·fpga开发·rdma·高速传输·cmac
RDMA设计15:连接管理模块设计2本博文主要交流设计思路,在本博客已给出相关博文140多篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。若有NVME或RDMA 产品及项目需求,请看B站视频后联系。
李洛克073 个月前
学习·rdma·路线
RDMA 编程完整学习路线图┌─────────────────────────────────────────────────────────────────┐ │ 第0阶段:基础准备 (1-2周) │ │ 网络编程基础 → Linux 系统编程 → C/C++ 熟练 → 内核基础概念 │ └─────────────────────────────────────────────────────────────────┘ ↓ ┌───────────────────────────────────────────────────
tiantianuser3 个月前
fpga开发·rdma·高速传输·cmac·roce v2
RDMA设计13:融合以太网协议栈设计2本文主要交流设计思路,在本博客已给出相关博文一百多篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。若有NVME或RDMA 产品及项目需求,请看B站视频后联系。