大数据学习(29)-spark on yarn底层原理

&&大数据学习&&

🔥系列专栏: 👑哲学语录: 承认自己的无知,乃是开启智慧的大门

💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞


Spark on Yarn的底层原理以下几个方面:

  1. 资源申请与调度:Spark通过YARN的接口向ResourceManager申请资源。ResourceManager根据集群的状态和应用程序的需求,为Spark分配相应的资源。Spark接收到资源后,通过YARN的接口与NodeManager通信,请求启动任务。
  2. 任务分配与执行:Spark ApplicationMaster启动后,会向ResourceManager注册并获取任务。然后,ApplicationMaster会根据任务的依赖关系和执行顺序,将任务分配给各个NodeManager执行。NodeManager负责启动和监控任务,并将任务的执行状态和结果报告给ApplicationMaster。
  3. 容错机制:YARN提供了容错机制,当某个NodeManager出现故障时,ResourceManager会重新为Spark分配资源,确保任务能够正常运行。
  4. 资源回收:当Spark应用程序完成后,ApplicationMaster会向ResourceManager注销,并释放资源。ResourceManager会将资源回收并重新分配给其他应用程序使用。

总的来说,Spark on Yarn的底层原理是通过YARN的资源管理和调度机制,为Spark应用程序提供资源分配、任务执行和容错处理等功能。

相关推荐
艾莉丝努力练剑22 分钟前
【C语言16天强化训练】从基础入门到进阶:Day 14
java·c语言·学习·算法
皮皮学姐分享-ppx1 小时前
机器人行业工商注册企业基本信息数据(1958-2023年)
大数据·人工智能·python·物联网·机器人·区块链
牛奶咖啡132 小时前
学习设计模式《二十四》——访问者模式
学习·设计模式·访问者模式·认识访问者模式·访问者模式的优缺点·何时选用访问者模式·访问者模式的使用示例
喻师傅2 小时前
横扫SQL面试——流量与转化率分类
大数据·数据仓库·sql
2025年一定要上岸3 小时前
【日常学习】2025-8-27 测开框架设计模式探索04
学习
武子康3 小时前
大数据-81 Spark 手把手搭建 分布式计算环境:从下载配置到多节点部署
大数据·后端·spark
Brookty3 小时前
深入解析Java并发编程与单例模式
java·开发语言·学习·单例模式·java-ee
孫治AllenSun3 小时前
【ElasticSearch】客户端选择
大数据·elasticsearch·jenkins
编码浪子3 小时前
趣味学习Rust基础篇(用Rust做一个猜数字游戏)
学习·rust
INS_KF4 小时前
【知识杂记】卡尔曼滤波及其变种,从理论精要到工程实践深入解析
经验分享·笔记·学习