分布式执行引擎ray入门--(1)简介

官网地址:Overview --- Ray 2.9.3

1.ray的概述?

Ray 是一个高性能的分布式执行引擎,开源的人工智能框架。旨在帮助开发者在原有代码上添加几行代码就可以进行分布式训练。

它由如下几个部分构成:

1)可扩展的库

用于常见的机器学习任务,如数据预处理、分布式训练、超参数调优、强化学习和模型服务。 2)Python风格的分布式计算原语

用于并行化和扩展Python应用程序。

3)集成和实用工具

用于将Ray集群与现有工具和基础设施(如Kubernetes、AWS、GCP和Azure)集成和部署。

ray对开发者友好,自动处理编排,调度,容错,自动扩展等相关方面的内容

2. ray的框架

ray的框架包含三层:

1)Ray AI Libraries

ML相关的一系列可拓展的同一开发工具

2)Ray Core

分布式计算,加速机器学习

3)Ray Clusters

和头节点关联的一系列工作节点,可固定,可拓展。

3.ray ML任务相关的五大library

  • Data: 可扩展的、与框架无关的数据加载和转换,适用于训练、调优和预测。

  • Train: 具有容错性的分布式多节点和多核模型训练,与流行的训练库集成。

  • Tune: 可扩展的超参数调优,以优化模型性能。

  • Serve: 可扩展和可编程的模型服务,用于在线推断部署,可选择微批处理以提高性能。

  • RLlib: 可扩展的分布式强化学习工作负载。

相关推荐
网络研究院1 小时前
OpenAI 的浏览器将使用 ChatGPT Agent 来控制浏览器
chatgpt
一只栖枝6 小时前
华为 HCIE 大数据认证中 Linux 命令行的运用及价值
大数据·linux·运维·华为·华为认证·hcie·it
喂完待续10 小时前
Apache Hudi:数据湖的实时革命
大数据·数据仓库·分布式·架构·apache·数据库架构
青云交10 小时前
Java 大视界 -- 基于 Java 的大数据可视化在城市交通拥堵治理与出行效率提升中的应用(398)
java·大数据·flink·大数据可视化·拥堵预测·城市交通治理·实时热力图
致Great14 小时前
DeepResearch开源与闭源方案对比
人工智能·chatgpt
还是大剑师兰特16 小时前
Flink面试题及详细答案100道(1-20)- 基础概念与架构
大数据·flink·大剑师·flink面试题
张飞的猪大数据17 小时前
OpenAI 发布了 GPT-5,有哪些新特性值得关注?国内怎么使用GPT5?
gpt·chatgpt
yh云想19 小时前
《从入门到精通:Kafka核心原理全解析》
分布式·kafka
1892280486120 小时前
NY243NY253美光固态闪存NY257NY260
大数据·网络·人工智能·缓存
武子康20 小时前
大数据-70 Kafka 日志清理:删除、压缩及混合模式最佳实践
大数据·后端·kafka