k8s通过NUMA亲和分配GPU和VF接口

问题

一般情况下,sriov插件和gpu分配插件是单独工作的,网卡和GPU没有根据连接关系分配

如果一个节点起了多个容器,会造成GPU和网卡的通信瓶颈

修改

如果一个点起两个容器,可以按照NUMA亲和来分配

修改kubelet配置文件/var/lib/kubelet/config.yaml

topologyManagerPolicy选择restricted

c 复制代码
topologyManagerPolicy: single-numa-node  [none|best-effort|restricted|single-numa-node]
topologyManagerScope: pod

然后:

c 复制代码
sudo systemctl daemon-reload
sudo systemctl restart kubelet
相关推荐
跟着珅聪学java5 小时前
Eureka 客户端状态为 DOWN 的解决方案
云原生·eureka
明灯L6 小时前
《Kubernetes 集群搭建全指南:从核心概念到环境部署!》
云原生·容器·kubernetes
insight^tkk6 小时前
【Docker】记录一次使用docker部署dify网段冲突的问题
运维·人工智能·docker·ai·容器
江湖人称小鱼哥6 小时前
WSL + Docker 网络访问详解
网络·docker·容器·wsl
韩宏伟6 小时前
使用 Loki + Promtail + Grafana 实现 Docker 容器日志采集与可视化
docker·容器·grafana
荣光波比8 小时前
K8S(十五)—— 企业级K8s集群管理实践:Rancher安装配置与核心功能实操
容器·kubernetes·rancher
没有bug.的程序员8 小时前
电商系统分布式架构实战:从单体到微服务的演进之路
java·分布式·微服务·云原生·架构·监控体系·指标采集
重生之我要当java大帝8 小时前
java微服务-尚医通-数据字典-5
vue.js·微服务·云原生·架构
小屁不止是运维9 小时前
k8s问题详解1:k8s集群上传文件过大导致413 Request Entity Too Large(请求文件实体过大)
docker·容器·kubernetes