技术栈
apache spark
AC使者
23 天前
apache spark
介绍 Apache Spark 的基本概念和在大数据分析中的应用
Apache Spark 是一个开源的大数据处理框架,它提供了快速、通用、可扩展的数据处理能力。Spark可以处理大规模数据集,并且在内存中进行数据操作,从而实现高速的数据处理和分析。
夜夜流光相皎洁_小宁
5 个月前
spark streaming
·
apache spark
·
spark 架构
·
spark 运行时架构
·
spark 组件角色
·
spark 生态
·
spark 特点
Apache Spark分布式计算框架架构介绍
目录一、概述二、Apache Spark架构组件栈2.1 概述2.2 架构图2.3 架构分层组件说明2.3.1 支持数据源
夜夜流光相皎洁_小宁
5 个月前
弹性分布式数据集
·
apache spark
·
spark rdd
·
rdd持久化
·
rdd partition分区
Spark 分布式弹性计算集(RDD)相关概念介绍
目录一、概述二、RDD的核心概念2.1 Partition2.2 Partitioner2.3 RDD的依赖关系
爱吃橘子的小青橘
7 个月前
apache spark
介绍 Apache Spark 的基本概念和在大数据分析中的应用
Apache Spark是一个快速、通用的大数据处理引擎,可以在集群中进行分布式数据处理和分析。它提供了一种高效的、易于使用的编程模型,并支持各种编程语言,如Scala、Java、Python和R等。