技术栈
tfjob
gs80140
2 天前
人工智能
·
分布式
·
深度学习
·
tensorflow
·
kubeflow
·
tfjob
使用 TFJob 进行分布式深度学习任务的多 GPU 协调指南
TFJob 是专门为 TensorFlow 提供的 Kubernetes 自定义资源定义(CRD)。通过它可以快速定义 Master、Worker、PS(参数服务器)等不同角色,以实现分布式深度学习任务。