技术栈
入门案例
Yan_bigdata
10 个月前
大数据
·
学习
·
spark
·
mapreduce
·
对比
·
词频统计
·
入门案例
Spark基础学习--基础介绍
Spark是可以处理大规模数据的统一分布式计算引擎。在之前我们学习过MapReduce,同样作为大数据分布式计算引擎,究竟这两者有什么区别呢? 首先我们回顾一下MapReduce的架构:MR基于HDFS实现大数据存储,基于Yarn做资源调度,且MR是基于进程处理数据的