分布式资源调度——yarn 概述(资源调度基本架构和高可用的实现)

此文章是学习笔记,图片均来源于B站:哈喽鹏程

yarn详细介绍

  • [1、yarn 简介](#1、yarn 简介)
    • [1.1 yarn的简介](#1.1 yarn的简介)
    • [1.2 yarn 的基本架构](#1.2 yarn 的基本架构)
    • [1.3. yarn 的高可用](#1.3. yarn 的高可用)
  • [2、yarn 调度策略、运维、监控](#2、yarn 调度策略、运维、监控)
    • [2.1 yarn 的调度策略](#2.1 yarn 的调度策略)
      • [2.1.1 FIFO scheduler(先进先出)](#2.1.1 FIFO scheduler(先进先出))
      • [2.1.2 容量调度](#2.1.2 容量调度)
      • [2.1.3 公平调度](#2.1.3 公平调度)
    • [2.2 yarn 的运维与管理](#2.2 yarn 的运维与管理)

1、yarn 简介

1.1 yarn的简介

1.2 yarn 的基本架构

1.3. yarn 的高可用

2、yarn 调度策略、运维、监控

2.1 yarn 的调度策略

2.1.1 FIFO scheduler(先进先出)

  • 调度策略:将所有任务放入一个队列,先进队列的先获得资源,排在后面的任务只有等待。
  • 缺点:a.资源利用率低,无法交叉完成任务;b.灵活性差,如紧急任务无法插队,耗时短的紧急任务只有等待。

2.1.2 容量调度

  • 预分队列,比如预分两个队列a、b;
  • 再将每个队列预分资源比如:a(80%),b(20%)
  • 如果资源a执行大作业,都在晚上进行。那么白天资源就浪费了。所以可以设置最大的资源占比。比如:白天的时候队列b 默认资源是20%,最多可以获得100% 的资源。
  • 容量调度器去配置的时候,可以在yarn -site .xml文件里面,配置调度的方式


2.1.3 公平调度



2.2 yarn 的运维与管理

yarn application [command_options]

相关推荐
herobrineAC7896 小时前
Hyperopt 强大的分布式参数优化框架全解析
分布式·其他
明达智控技术6 小时前
MR30系列分布式I/O在造型机产线的应用
分布式·物联网·自动化
Moniane6 小时前
A2A+MCP构建智能体协作生态:下一代分布式人工智能架构解析
人工智能·分布式·架构
码界奇点8 小时前
Apache IoTDB 架构特性与 PrometheusGrafana 监控体系部署实践
架构·apache·grafana·prometheus·iotdb
꒰ঌ 安卓开发໒꒱8 小时前
RabbitMQ面试全解析:从核心概念到高可用架构
面试·架构·rabbitmq
JZC_xiaozhong9 小时前
异构系统集成提速:重构企业数据流转架构
大数据·重构·架构·数据分析·etl工程师·数据集成与应用集成·异构数据整合
想ai抽12 小时前
从文件结构、索引、数据更新、版本控制等全面对比Apache hudi和Apache paimon
大数据·架构·flink
pccai-vip13 小时前
架构论文《论数字孪生系统架构设计与应用》
架构·系统架构
数据智能老司机14 小时前
Apache Hudi权威指南——维护与优化 Hudi 表
大数据·架构·数据分析
LoveDreaMing14 小时前
微前端-无界的实操和源码分析
前端·javascript·架构