k8s POD上RDMA网卡VF不生效问题

1、配置

multus、sriov-device-plugin、whereabouts都来自https://github.com/k8snetworkplumbingwg/

有的环境总是看不到POD内的RDMA接口,有的环境node重启后再启动的pod看不到

现象为pod内执行ifconfig看不到接口,或者kubectl describe pod pod-1中没有:

2、查看sriov-device-plugin和multus

2.1 sriov-device-plugin

pod启动后,可以看到sriov分配了RDMA网卡:

cat /var/log/sriovdp/sriovdp.INFO

...

server.go:159\] AllocateResponse send: \&AllocateResponNOX_COM_MLNX_SRIOV_RDMA0: 0000:27:00.1, ### 2.2 multus kubectl logs kube-multus-ds-amd64-h59ln -n kube-system ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/9658670a33e64460888560f6ee35aca1.png) 可以看到生成了配置文件,根据pod的描述/host/etc/cni/net.d/映射到了/etc/cni/net.d/ 但是对应目录没有这个文件,只有00-multus.conf.cilium_bak 这是被cilium改掉了 ## 3 修改 ```bash kubectl edit cm cilium-config -n kube-system ``` 将cni-exclusive: "true"修改为cni-exclusive: "false" 注:cni-exclusive设置为true会把其他cni的conf文件都覆盖掉 然后重启cilium: ```bash kubectl rollout restart daemonset/cilium -n kube-system ```

相关推荐
阿里云云原生3 天前
阿里云获评 Agentic AI 开发平台领导者,函数计算 AgentRun 赢下关键分!
云原生
蝎子莱莱爱打怪3 天前
Centos7中一键安装K8s集群以及Rancher安装记录
运维·后端·kubernetes
崔小汤呀3 天前
Docker部署Nacos
docker·容器
缓解AI焦虑3 天前
Docker + K8s 部署大模型推理服务:资源划分与多实例调度
docker·容器
阿里云云原生3 天前
MSE Nacos Prompt 管理:让 AI Agent 的核心配置真正可治理
微服务·云原生
阿里云云原生3 天前
当 AI Agent 接管手机:移动端如何进行观测
云原生·agent
阿里云云原生3 天前
AI 原生应用开源开发者沙龙·深圳站精彩回顾 & PPT下载
云原生
阿里云云原生3 天前
灵感启发:日产文章 100 篇,打造“实时热点洞察”引擎
云原生
1candobetter4 天前
Docker Compose Build 与 Up 的区别:什么时候必须重建镜像
docker·容器·eureka
~莫子4 天前
Haproxy七层负载详解+实验详细代码
云原生