一键部署 GPU Kind 集群,体验 vLLM 极速推理随着 Kubernetes 在大模型训练和推理领域的广泛应用,越来越多的开发者需要在本地环境中搭建支持 GPU 的 Kubernetes 集群,以便进行测试和开发。大家都知道,本地搭建 Kubernetes 集群通常可以使用 Kind(Kubernetes IN Docker),它轻量、快速且易于使用。但是,如果要搭建一个可以使用 GPU 的 Kind 集群,就需要进行一些额外的工作。比如,需要安装 GPU 驱动、配置 NVIDIA Container Toolkit、设置 NVIDIA Containe