mellanox

北冥有鱼被烹4 天前
mellanox
【微知】Mellanox网卡网线插入后驱动的几个日志?(Cable plugged;IPv6 ... link becomes ready)本文是一个简单的信息记录。记录的是当服务器网卡的光模块插入后内核的日志打印。通过这种日志打印,可以在定位分析问题的时候,知道进行过一次模块插拔。
北冥有鱼被烹1 个月前
gpu·mellanox
【问题记录】如何编译nv_peer_memory模块?依赖OFED的4个目录和2类文件?如何解决没有rdma/peer_mem.h文件?GDR:GPUDirect RDMA。这项新技术在 GPU 内存之间直接与 NVIDIA HCA/NIC 设备之间提供直接的 P2P(点对点)数据路径。这显着降低了 GPU-GPU 通信延迟,并完全减轻了 CPU 的负担。nv_peer_memory模块是网卡提供给GPU使用GDR技术的模块,介于GPU驱动和OFED之间。 nv_peer_memory依赖OFED的接口。
北冥有鱼被烹5 个月前
rdma·mellanox
微知-ib_write_bw的各种参数汇总(-d -q -s -R --run_infinitely)经常忘记使用ib_write_bw打流的一些参数,特此整理记录在这里方便快速查阅。尤其是run_infinitely这个参数容易写错。
北冥有鱼被烹6 个月前
dpu·mellanox
NVIDIA Bluefield DPU上的启动流程4个阶段分别是什么?作用是什么?本文以Bluefield2为例,可以看到RSHIM实际上是Boot相关的集合。也能看到eMMC上的2个分区。 Bluefield硬件单元图:(尤其可以看到RSHIM在硬件形态上是一个单独的硬件) Bluefield接口图:
北冥有鱼被烹6 个月前
dpu·mellanox·bluefield
微知-Bluefield DPU使用flint烧录固件报错MFE_NO_FLASH_DETECTED是什么?MFE是什么?在DPU的fw操作flint的时候,很多命令都会报这个错误:MFE_NO_FLASH_DETECTED,早期很疑惑并且猜测MFE是Mellanox Firmware Engine。实际并不是,具体还得走到mellanox flash的代码,该部分代码是Mellanox flint的一个库。
北冥有鱼被烹1 年前
rdma·dpu·mellanox
【DPU系列之】Bluefield 2 DPU卡的功能图,ConnectX网卡、ARM OS、Host OS的关系?(通过PCIe Switch连接)核心要点:简要记录。图片来源:https://docs.nvidia.com/networking/display/bluefielddpuosv460/functional+diagram