Spark处理过程-转换算子和行动算子（一）

CONTONUE2025-05-13 11:28

（一） RDD的处理过程

RDD经过一系列的"转换"操作，每一次转换都会产生不同的RDD，以供给下一次"转换"操作使用，直到最后一个RDD经过"行动"操作才会真正被计算处理。

延迟。RDD中所有的转换都是延迟的，它们并不会直接计算结果。相反，他们只是记住这些应用到基础数据集上的转换动作。只有当发生要求返回结果给driver的动作时，这些转换才会真正运行。
血缘关系。一个RDD运算之后，会产生新的RDD。

上一篇：配置yarn模式

下一篇：word换行符和段落标记

热门推荐

01GitHub 镜像站点 02BongoCat - 跨平台键盘猫动画工具 03UV安装并设置国内源 04Linux下V2Ray安装配置指南 05安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）06综合整理：pdf预览显示：你尝试预览的文件可能对你的计算机有害。如果你信任此文件以及其来源，请打开此文件以看其内容，如何解决以正常预览文件 07《大数据技术原理与应用》实验报告三熟悉HBase常用操作 08jdk21下载、安装（Windows、Linux、macOS）09PyCharm 社区版全平台安装指南 10npm使用国内淘宝镜像的方法