kubeflow简单记录

kubeflow 13.7k star

1、Training Operator 包括PytorchJob和XGboostJob,支持部署pytorch的分布式训练

2、KFServing快捷的部署推理服务

3、Jupyter Notebook 基于Web的交互式工具

4、Katib做超参数优化

5、Pipeline 基于Argo Workflow提供机器学习流程的创建、编排调度和管理,端到端机器学习系统的自动化敏捷构建,实现AI领域的DevOps。

6、模型评测

pipeline流程

pipeline示例

相关推荐
waicsdn_haha23 天前
Kubeflow 2025 全栈式机器学习平台部署指南(云原生+量子混合计算)
python·神经网络·云原生·开放原子·apache·量子计算·kubeflow
gs801403 个月前
Kubeflow:云原生机器学习工作流自动化开源框架详解
人工智能·kubeflow
gs801403 个月前
用CRD定义未来:解锁机器学习平台的无限可能
kubernetes·crd·operator·kubeflow·机器学习平台·分布式训练任务
gs801403 个月前
使用 TFJob 进行分布式深度学习任务的多 GPU 协调指南
人工智能·分布式·深度学习·tensorflow·kubeflow·tfjob
青云交5 个月前
大数据新视界 --大数据大厂之 Kubeflow 在大数据与机器学习融合中的应用探索
大数据·机器学习·数据处理·模型训练·应用案例·kubeflow·资源利用
寻花之梦~~1 年前
k8s部署Kubeflow v1.7.0
kubeflow
whyte王1 年前
Kubeflow文档1:介绍与架构
架构·kubernetes·云计算·kubeflow