大数据学习(29)-spark on yarn底层原理

&&大数据学习&&

🔥系列专栏: 👑哲学语录: 承认自己的无知,乃是开启智慧的大门

💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞


Spark on Yarn的底层原理以下几个方面:

  1. 资源申请与调度:Spark通过YARN的接口向ResourceManager申请资源。ResourceManager根据集群的状态和应用程序的需求,为Spark分配相应的资源。Spark接收到资源后,通过YARN的接口与NodeManager通信,请求启动任务。
  2. 任务分配与执行:Spark ApplicationMaster启动后,会向ResourceManager注册并获取任务。然后,ApplicationMaster会根据任务的依赖关系和执行顺序,将任务分配给各个NodeManager执行。NodeManager负责启动和监控任务,并将任务的执行状态和结果报告给ApplicationMaster。
  3. 容错机制:YARN提供了容错机制,当某个NodeManager出现故障时,ResourceManager会重新为Spark分配资源,确保任务能够正常运行。
  4. 资源回收:当Spark应用程序完成后,ApplicationMaster会向ResourceManager注销,并释放资源。ResourceManager会将资源回收并重新分配给其他应用程序使用。

总的来说,Spark on Yarn的底层原理是通过YARN的资源管理和调度机制,为Spark应用程序提供资源分配、任务执行和容错处理等功能。

相关推荐
互联网科技看点1 小时前
孕期科学补铁,保障母婴健康-仁合益康蛋白琥珀酸铁口服溶液成为产妇优选方案
大数据
Dxy12393102162 小时前
深度解析 Elasticsearch:从倒排索引到 DSL 查询的实战突围
大数据·elasticsearch·搜索引擎
YongCheng_Liang2 小时前
零基础学大数据:大数据基础与前置技术夯实
大数据·big data
AC赳赳老秦2 小时前
2026国产算力新周期:DeepSeek实战适配英伟达H200,引领大模型训练效率跃升
大数据·前端·人工智能·算法·tidb·memcache·deepseek
ZH15455891312 小时前
Flutter for OpenHarmony Python学习助手实战:GUI桌面应用开发的实现
python·学习·flutter
鹏说大数据2 小时前
Spark 和 Hive 的关系与区别
大数据·hive·spark
B站计算机毕业设计超人2 小时前
计算机毕业设计Hadoop+Spark+Hive招聘推荐系统 招聘大数据分析 大数据毕业设计(源码+文档+PPT+ 讲解)
大数据·hive·hadoop·python·spark·毕业设计·课程设计
B站计算机毕业设计超人2 小时前
计算机毕业设计hadoop+spark+hive交通拥堵预测 交通流量预测 智慧城市交通大数据 交通客流量分析(源码+LW文档+PPT+讲解视频)
大数据·hive·hadoop·python·spark·毕业设计·课程设计
数据架构师的AI之路2 小时前
深入了解大数据领域Hive的HQL语言特性
大数据·hive·hadoop·ai
L***一2 小时前
大数据技术专业中专生职业发展路径探析
大数据