hadoop的MapReduce

1.什么是计算(广义): 内容分析, 得到需要的结果

也就是一系列, 基于数据得出的结论。 这些就是我们所说的计算。

2.分布式计算模式:

一:分散-汇总模式:数据分片,多个服务器负责各个部分数据处理,最后结果汇总

二:中心调度模式: 1. 由一个节点作为中心调度管理者 2. 将任务划分为几个具体步骤 3. 管理者安排每个机器执行任务 4. 最终得到结果数据

3.MapReduce(hadoop的计算组件)(hive的底层工具)

一:利用的是分散-汇总模式

二:编程接口:map(分散)与reduce(汇总)

相关推荐
Fcy64829 分钟前
Linux下的项目自动化构建-make\makefile详解
linux·运维·自动化·makefile·make
keep__go1 小时前
zookeeper单机版安装
大数据·运维·zookeeper
chde2Wang1 小时前
Linux中bash: ls: 未找到命令… 相似命令是: ‘lz‘
linux·运维·bug·bash
serendipity_hky1 小时前
【微服务 - easy视频 | day04】Seata解决分布式事务
java·spring boot·分布式·spring cloud·微服务·架构
楼田莉子2 小时前
Linux学习:进程的控制
linux·运维·服务器·c语言·后端·学习
JiMoKuangXiangQu2 小时前
Linux:文件 mmap 读写流程简析
linux·内存管理·file mmap
Serverless 社区2 小时前
助力企业构建 AI 原生应用,函数计算FunctionAI 重塑模型服务与 Agent 全栈生态
大数据·人工智能
回家路上绕了弯2 小时前
服务器大量请求超时?从网络到代码的全链路排查指南
分布式·后端
武子康2 小时前
大数据-150 Apache Druid 单机部署实战:架构速览、启动清单与故障速修
大数据·后端·apache
洋芋土豆3 小时前
linux用户及权限管理
linux·运维·服务器