技术栈

入门案例

Yan_bigdata
1 年前
大数据·学习·spark·mapreduce·对比·词频统计·入门案例
Spark基础学习--基础介绍Spark是可以处理大规模数据的统一分布式计算引擎。在之前我们学习过MapReduce,同样作为大数据分布式计算引擎,究竟这两者有什么区别呢? 首先我们回顾一下MapReduce的架构:MR基于HDFS实现大数据存储,基于Yarn做资源调度,且MR是基于进程处理数据的