分布式资源调度——yarn 概述(资源调度基本架构和高可用的实现)

此文章是学习笔记,图片均来源于B站:哈喽鹏程

yarn详细介绍

  • [1、yarn 简介](#1、yarn 简介)
    • [1.1 yarn的简介](#1.1 yarn的简介)
    • [1.2 yarn 的基本架构](#1.2 yarn 的基本架构)
    • [1.3. yarn 的高可用](#1.3. yarn 的高可用)
  • [2、yarn 调度策略、运维、监控](#2、yarn 调度策略、运维、监控)
    • [2.1 yarn 的调度策略](#2.1 yarn 的调度策略)
      • [2.1.1 FIFO scheduler(先进先出)](#2.1.1 FIFO scheduler(先进先出))
      • [2.1.2 容量调度](#2.1.2 容量调度)
      • [2.1.3 公平调度](#2.1.3 公平调度)
    • [2.2 yarn 的运维与管理](#2.2 yarn 的运维与管理)

1、yarn 简介

1.1 yarn的简介

1.2 yarn 的基本架构

1.3. yarn 的高可用

2、yarn 调度策略、运维、监控

2.1 yarn 的调度策略

2.1.1 FIFO scheduler(先进先出)

  • 调度策略:将所有任务放入一个队列,先进队列的先获得资源,排在后面的任务只有等待。
  • 缺点:a.资源利用率低,无法交叉完成任务;b.灵活性差,如紧急任务无法插队,耗时短的紧急任务只有等待。

2.1.2 容量调度

  • 预分队列,比如预分两个队列a、b;
  • 再将每个队列预分资源比如:a(80%),b(20%)
  • 如果资源a执行大作业,都在晚上进行。那么白天资源就浪费了。所以可以设置最大的资源占比。比如:白天的时候队列b 默认资源是20%,最多可以获得100% 的资源。
  • 容量调度器去配置的时候,可以在yarn -site .xml文件里面,配置调度的方式


2.1.3 公平调度



2.2 yarn 的运维与管理

yarn application [command_options]

相关推荐
桌面运维家5 分钟前
vDisk VOI架构IO瓶颈怎么办?Windows优化实战
windows·架构
前端不太难1 小时前
从本地到多端:HarmonyOS 分布式数据管理实战详解
分布式·状态模式·harmonyos
Yeats_Liao1 小时前
MindSpore开发之路(二十五):融入开源:如何为MindSpore社区贡献力量
人工智能·分布式·深度学习·机器学习·华为·开源
Blossom.1181 小时前
Transformer架构优化实战:从MHA到MQA/GQA的显存革命
人工智能·python·深度学习·react.js·架构·aigc·transformer
Python_Study20252 小时前
制造业数据采集系统选型指南:从技术挑战到架构实践
大数据·网络·数据结构·人工智能·架构
喵叔哟2 小时前
8.健康检查与监控
架构·.net
踏浪无痕3 小时前
JobFlow 负载感知调度:把任务分给最闲的机器
后端·架构·开源
编程点滴3 小时前
高并发与分布式系统中的幂等处理
架构
我爱娃哈哈3 小时前
SpringBoot + Seata + Nacos:分布式事务落地实战,订单-库存一致性全解析
spring boot·分布式·后端
JZC_xiaozhong3 小时前
主数据同步失效引发的业务风险与集成架构治理
大数据·架构·数据一致性·mdm·主数据管理·数据孤岛解决方案·数据集成与应用集成