分布式通用计算——MapReduce(重点在shuffle 阶段)

图片均来源于B站:哈喽鹏程

面向批处理的分布式计算框架------MapReduce

  • [1、Mapreduce 起源](#1、Mapreduce 起源)
  • 2、适用场景
  • [3、MapReduce 词频统计原理](#3、MapReduce 词频统计原理)

1、Mapreduce 起源


2、适用场景

3、MapReduce 词频统计原理

  • map 阶段到reduce阶段,通过hash取模来实现reduce 。比如:有4个reduce块,通过将map<key,value>中的key转换为数值,除以4.取模进行归类。


相关推荐
我的棉裤丢了35 分钟前
windows安装ES
大数据·elasticsearch·搜索引擎
想做富婆36 分钟前
大数据,Hadoop,HDFS的简单介绍
大数据·hadoop·分布式
金融OG1 小时前
99.8 金融难点通俗解释:净资产收益率(ROE)
大数据·python·线性代数·机器学习·数学建模·金融·矩阵
霍格沃兹测试开发学社测试人社区1 小时前
软件测试丨消息管道(Kafka)测试体系
软件测试·分布式·测试开发·kafka
希艾席蒂恩1 小时前
专业数据分析不止于Tableau,四款小众报表工具解析
大数据·信息可视化·数据分析·数据可视化·报表工具
JZC_xiaozhong2 小时前
低空经济中的数据孤岛难题,KPaaS如何破局?
大数据·运维·数据仓库·安全·ci/cd·数据分析·数据库管理员
乙卯年QAQ3 小时前
【Elasticsearch】RestClient操作文档
java·大数据·elasticsearch·jenkins
weisian1513 小时前
消息队列篇--原理篇--RocketMQ和Kafka对比分析
分布式·kafka·rocketmq