k8s通过NUMA亲和分配GPU和VF接口

问题

一般情况下,sriov插件和gpu分配插件是单独工作的,网卡和GPU没有根据连接关系分配

如果一个节点起了多个容器,会造成GPU和网卡的通信瓶颈

修改

如果一个点起两个容器,可以按照NUMA亲和来分配

修改kubelet配置文件/var/lib/kubelet/config.yaml

topologyManagerPolicy选择restricted

c 复制代码
topologyManagerPolicy: single-numa-node  [none|best-effort|restricted|single-numa-node]
topologyManagerScope: pod

然后:

c 复制代码
sudo systemctl daemon-reload
sudo systemctl restart kubelet
相关推荐
风落无尘1 小时前
Stable Diffusion WebUI & ComfyUI 完整安装教程:官方部署+一键整合包+Docker容器化(2026最新)
docker·容器·stable diffusion
CodeMartain6 小时前
Dify Windows 原生部署(无 Docker、纯本地)
运维·docker·容器
牛奶咖啡137 小时前
k8s容器编排技术实践——使用containerd作为容器运行时部署k8s集群
kubernetes·k8s的安装部署·开启系统的ipvs支持·安装containerd·containerd配置加速器·安装k8s的工具·安装calico网络插件
万里侯7 小时前
云原生数据备份与恢复:保障数据安全的最佳实践
微服务·容器·k8s
llrraa20107 小时前
配置docker国内镜像源
运维·docker·容器
阿里云云原生7 小时前
阿里云 STAROps 全域智能运维平台发布!从“被动救火”到“主动自治”
云原生
2301_780789668 小时前
手游遇到攻击为什么要用SDK游戏盾手游遇到攻击为什么要用 SDK 游戏盾?
安全·web安全·游戏·架构·kubernetes·ddos
35岁程序员的自救之路9 小时前
AiBBS - 面向下一个十年的AI + 云原生社区系统
人工智能·云原生
珂玥c9 小时前
k8s集群ingress碎碎念
云原生·容器·kubernetes
佳杰云星9 小时前
如何给大模型集群选“大脑”?智算调度与管理平台 10 维选型指南(附选型评分表)
人工智能·kubernetes·大模型·云计算·gpu·算力调度·智算中心