分布式通用计算——MapReduce（重点在shuffle 阶段）

okmacong2024-12-03 9:38

图片均来源于B站：哈喽鹏程

面向批处理的分布式计算框架------MapReduce

[1、Mapreduce 起源](#1、Mapreduce 起源)

2、适用场景

[3、MapReduce 词频统计原理](#3、MapReduce 词频统计原理)

1、Mapreduce 起源

2、适用场景

3、MapReduce 词频统计原理

map 阶段到reduce阶段，通过hash取模来实现reduce 。比如：有4个reduce块，通过将map<key,value>中的key转换为数值，除以4.取模进行归类。

上一篇：分布式资源调度——yarn 概述（资源调度基本架构和高可用的实现）

下一篇：AIoT赋能下的智慧园区管理系统，构建新一代智能园区

热门推荐

01GitHub 镜像站点 022026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 03AI科技热点日报 | 2026年07月01日 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07Codex 下载安装指南：Windows 和 macOS 官方版下载 08国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）09GPT-5.5 对比 GPT-5.6 Sol、Terra、Luna：官方性能数据与选型分析 10几个好用的ip纯净度检测网站