技术栈

tfjob

gs80140
5 个月前
人工智能·分布式·深度学习·tensorflow·kubeflow·tfjob
使用 TFJob 进行分布式深度学习任务的多 GPU 协调指南TFJob 是专门为 TensorFlow 提供的 Kubernetes 自定义资源定义(CRD)。通过它可以快速定义 Master、Worker、PS(参数服务器)等不同角色,以实现分布式深度学习任务。