k8s通过NUMA亲和分配GPU和VF接口

问题

一般情况下,sriov插件和gpu分配插件是单独工作的,网卡和GPU没有根据连接关系分配

如果一个节点起了多个容器,会造成GPU和网卡的通信瓶颈

修改

如果一个点起两个容器,可以按照NUMA亲和来分配

修改kubelet配置文件/var/lib/kubelet/config.yaml

topologyManagerPolicy选择restricted

c 复制代码
topologyManagerPolicy: single-numa-node  [none|best-effort|restricted|single-numa-node]
topologyManagerScope: pod

然后:

c 复制代码
sudo systemctl daemon-reload
sudo systemctl restart kubelet
相关推荐
wuxingge31 分钟前
k8s部署xxl-job
容器·kubernetes
没有bug.的程序员2 小时前
微服务基础设施清单:必须、应该、可以、无需的四级分类指南
java·jvm·微服务·云原生·容器·架构
百以国际食品有限公司2 小时前
奶茶原料珍珠粉圆品质保证
云原生
Lethehong3 小时前
【探索实战】Kurator分布式云原生平台快速上手与实战指南
分布式·云原生
百以国际食品有限公司3 小时前
奶茶原料珍珠粉圆供应商
云原生
Lethehong3 小时前
【探索实战】Kurator分布式云原生平台全栈实践指南:从入门到企业级落地
分布式·云原生
weixin_462446234 小时前
【实战原创】Docker 清理指南:以 Coze Studio 为例的资源保留与清理实践(非万能方案)
docker·容器·eureka
hkNaruto4 小时前
【docker】docker exec -it 报错 open /dev/pts/0: operation not permitted
运维·docker·容器
一个想打拳的程序员4 小时前
无需复杂配置!用%20docker-webtop%20打造跨设备通用%20Linux%20桌面,加载cpolar远程访问就这么简单
java·人工智能·docker·容器
Wang's Blog4 小时前
RabbitMQ: 解析Kubernetes原理与高可用集群部署实践
分布式·kubernetes·rabbitmq