图片均来源于B站:哈喽鹏程
面向批处理的分布式计算框架------MapReduce
- [1、Mapreduce 起源](#1、Mapreduce 起源)
- 2、适用场景
- [3、MapReduce 词频统计原理](#3、MapReduce 词频统计原理)
1、Mapreduce 起源
2、适用场景
3、MapReduce 词频统计原理
- map 阶段到reduce阶段,通过hash取模来实现reduce 。比如:有4个reduce块,通过将map<key,value>中的key转换为数值,除以4.取模进行归类。