分布式执行引擎ray入门--(1)简介

官网地址:Overview --- Ray 2.9.3

1.ray的概述?

Ray 是一个高性能的分布式执行引擎,开源的人工智能框架。旨在帮助开发者在原有代码上添加几行代码就可以进行分布式训练。

它由如下几个部分构成:

1)可扩展的库

用于常见的机器学习任务,如数据预处理、分布式训练、超参数调优、强化学习和模型服务。 2)Python风格的分布式计算原语

用于并行化和扩展Python应用程序。

3)集成和实用工具

用于将Ray集群与现有工具和基础设施(如Kubernetes、AWS、GCP和Azure)集成和部署。

ray对开发者友好,自动处理编排,调度,容错,自动扩展等相关方面的内容

2. ray的框架

ray的框架包含三层:

1)Ray AI Libraries

ML相关的一系列可拓展的同一开发工具

2)Ray Core

分布式计算,加速机器学习

3)Ray Clusters

和头节点关联的一系列工作节点,可固定,可拓展。

3.ray ML任务相关的五大library

  • Data: 可扩展的、与框架无关的数据加载和转换,适用于训练、调优和预测。

  • Train: 具有容错性的分布式多节点和多核模型训练,与流行的训练库集成。

  • Tune: 可扩展的超参数调优,以优化模型性能。

  • Serve: 可扩展和可编程的模型服务,用于在线推断部署,可选择微批处理以提高性能。

  • RLlib: 可扩展的分布式强化学习工作负载。

相关推荐
AI数据皮皮侠5 小时前
中国各省森林覆盖率等数据(2000-2023年)
大数据·人工智能·python·深度学习·机器学习
大有数据可视化9 小时前
数字孪生背后的大数据技术:时序数据库为何是关键?
大数据·数据库·人工智能
Elastic 中国社区官方博客10 小时前
CI/CD 流水线与 agentic AI:如何创建自我纠正的 monorepos
大数据·运维·数据库·人工智能·搜索引擎·ci/cd·全文检索
理智的煎蛋13 小时前
基于 Celery 的分布式文件监控系统
redis·分布式·python·mysql·mongodb
计算机毕设残哥15 小时前
基于Hadoop+Spark的商店购物趋势分析与可视化系统技术实现
大数据·hadoop·python·scrapy·spark·django·dash
IT研究室15 小时前
大数据毕业设计选题推荐-基于大数据的全球能源消耗量数据分析与可视化系统-大数据-Spark-Hadoop-Bigdata
大数据·hadoop·spark·毕业设计·源码·数据可视化·bigdata
武子康15 小时前
大数据-113 Flink 源算子详解:非并行源(Non-Parallel Source)的原理与应用场景
大数据·后端·flink
失散1317 小时前
分布式专题——22 Kafka集群工作机制详解
java·分布式·云原生·架构·kafka
禁默17 小时前
第四届云计算、大数据应用与软件工程国际学术会议(CBASE 2025)
大数据·云计算
Lansonli18 小时前
大数据Spark(六十五):Transformation转换算子groupByKey和filter
大数据·分布式·spark