分布式执行引擎ray入门--(1)简介

官网地址:Overview --- Ray 2.9.3

1.ray的概述?

Ray 是一个高性能的分布式执行引擎,开源的人工智能框架。旨在帮助开发者在原有代码上添加几行代码就可以进行分布式训练。

它由如下几个部分构成:

1)可扩展的库

用于常见的机器学习任务,如数据预处理、分布式训练、超参数调优、强化学习和模型服务。 2)Python风格的分布式计算原语

用于并行化和扩展Python应用程序。

3)集成和实用工具

用于将Ray集群与现有工具和基础设施(如Kubernetes、AWS、GCP和Azure)集成和部署。

ray对开发者友好,自动处理编排,调度,容错,自动扩展等相关方面的内容

2. ray的框架

ray的框架包含三层:

1)Ray AI Libraries

ML相关的一系列可拓展的同一开发工具

2)Ray Core

分布式计算,加速机器学习

3)Ray Clusters

和头节点关联的一系列工作节点,可固定,可拓展。

3.ray ML任务相关的五大library

  • Data: 可扩展的、与框架无关的数据加载和转换,适用于训练、调优和预测。

  • Train: 具有容错性的分布式多节点和多核模型训练,与流行的训练库集成。

  • Tune: 可扩展的超参数调优,以优化模型性能。

  • Serve: 可扩展和可编程的模型服务,用于在线推断部署,可选择微批处理以提高性能。

  • RLlib: 可扩展的分布式强化学习工作负载。

相关推荐
忆~遂愿14 分钟前
GE 引擎与算子版本控制:确保前向兼容性与图重写策略的稳定性
大数据·开发语言·docker
米羊12128 分钟前
已有安全措施确认(上)
大数据·网络
人道领域2 小时前
AI抢人大战:谁在收割你的红包
大数据·人工智能·算法
qq_12498707532 小时前
基于Hadoop的信贷风险评估的数据可视化分析与预测系统的设计与实现(源码+论文+部署+安装)
大数据·人工智能·hadoop·分布式·信息可视化·毕业设计·计算机毕业设计
Hello.Reader2 小时前
Flink 使用 Amazon S3 读写、Checkpoint、插件选择与性能优化
大数据·flink
零售ERP菜鸟3 小时前
范式革命:从“信息化”到“数字化”的本质跃迁
大数据·人工智能·职场和发展·创业创新·学习方法·业界资讯
Hello.Reader3 小时前
Flink 对接 Google Cloud Storage(GCS)读写、Checkpoint、插件安装与生产配置指南
大数据·flink
浪子小院4 小时前
ModelEngine 智能体全流程开发实战:从 0 到 1 搭建多协作办公助手
大数据·人工智能
Coder_Boy_4 小时前
基于Spring AI的分布式在线考试系统-事件处理架构实现方案
人工智能·spring boot·分布式·spring
AEIC学术交流中心5 小时前
【快速EI检索 | ACM出版】2026年大数据与智能制造国际学术会议(BDIM 2026)
大数据·制造