k8s通过NUMA亲和分配GPU和VF接口

问题

一般情况下,sriov插件和gpu分配插件是单独工作的,网卡和GPU没有根据连接关系分配

如果一个节点起了多个容器,会造成GPU和网卡的通信瓶颈

修改

如果一个点起两个容器,可以按照NUMA亲和来分配

修改kubelet配置文件/var/lib/kubelet/config.yaml

topologyManagerPolicy选择restricted

c 复制代码
topologyManagerPolicy: single-numa-node  [none|best-effort|restricted|single-numa-node]
topologyManagerScope: pod

然后:

c 复制代码
sudo systemctl daemon-reload
sudo systemctl restart kubelet
相关推荐
阿里云云原生6 小时前
拒绝月底“账单惊魂”:AI 网关如何通过“消费者配额”实现大模型调用成本治理?
云原生
网络中的夜鹰6 小时前
轩辕镜像一键安装Docker和Docker Compose脚本
运维·docker·容器
lihongbao806 小时前
kuboard v3创建用户分配命名空间
kubernetes·kuboard
江湖有缘9 小时前
Docker部署HamsterBase Tasks任务管理工具
运维·docker·容器
很楠爱上9 小时前
Docker 从入门到实战:核心概念、微服务编排与环境移植完全指南
docker·微服务·容器
Qres82110 小时前
docker & WSL & Ubuntu安装记录
ubuntu·docker·容器·wsl
java_cj10 小时前
从kubectl源码学pprof:生产环境性能分析的实战指南
运维·云原生·容器·kubernetes
吠品11 小时前
Docker 构建时网络超时拉不到镜像?一些排查和配置记录
云原生·eureka
爱吃龙利鱼12 小时前
K8s 监控实战:victoria-metrics-k8s-stack 高可用部署,资源占用直降 70%,比 Prometheus 省 5 倍磁盘
docker·kubernetes·prometheus
STDD12 小时前
Kubeflow ML 流水线 K8s 部署教程:机器学习工作流编排全攻略
机器学习·容器·kubernetes