大数据学习(29)-spark on yarn底层原理

&&大数据学习&&

🔥系列专栏: 👑哲学语录: 承认自己的无知,乃是开启智慧的大门

💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞


Spark on Yarn的底层原理以下几个方面:

  1. 资源申请与调度:Spark通过YARN的接口向ResourceManager申请资源。ResourceManager根据集群的状态和应用程序的需求,为Spark分配相应的资源。Spark接收到资源后,通过YARN的接口与NodeManager通信,请求启动任务。
  2. 任务分配与执行:Spark ApplicationMaster启动后,会向ResourceManager注册并获取任务。然后,ApplicationMaster会根据任务的依赖关系和执行顺序,将任务分配给各个NodeManager执行。NodeManager负责启动和监控任务,并将任务的执行状态和结果报告给ApplicationMaster。
  3. 容错机制:YARN提供了容错机制,当某个NodeManager出现故障时,ResourceManager会重新为Spark分配资源,确保任务能够正常运行。
  4. 资源回收:当Spark应用程序完成后,ApplicationMaster会向ResourceManager注销,并释放资源。ResourceManager会将资源回收并重新分配给其他应用程序使用。

总的来说,Spark on Yarn的底层原理是通过YARN的资源管理和调度机制,为Spark应用程序提供资源分配、任务执行和容错处理等功能。

相关推荐
Elastic 中国社区官方博客3 小时前
在 Elasticsearch 中使用 Mistral Chat completions 进行上下文工程
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
橙色云-智橙协同研发3 小时前
从 CAD 图纸到 Excel 数据:橙色云智橙 PLM 打造制造企业数字化协同新模式
大数据·功能测试·云原生·cad·plm·云plm·bom提取
容器( ु⁎ᴗ_ᴗ⁎)ु.。oO4 小时前
Magentic-ui 学习
学习
喝可乐的希饭a4 小时前
Elasticsearch 的 Routing 策略详解
大数据·elasticsearch·搜索引擎
_李小白4 小时前
【OPENGL ES 3.0 学习笔记】延伸阅读:VAO与VBO
笔记·学习·elasticsearch
微露清风6 小时前
系统性学习C++-第九讲-list类
c++·学习·list
海边夕阳20066 小时前
【每天一个AI小知识】:什么是零样本学习?
人工智能·经验分享·学习
梦里不知身是客116 小时前
sparkSQL读取数据的方式
spark
TDengine (老段)6 小时前
TDengine 字符串函数 CHAR 用户手册
java·大数据·数据库·物联网·时序数据库·tdengine·涛思数据
2501_933670796 小时前
高职大数据技术专业需要的基础
大数据