hadoop的MapReduce

1.什么是计算(广义): 内容分析, 得到需要的结果

也就是一系列, 基于数据得出的结论。 这些就是我们所说的计算。

2.分布式计算模式:

一:分散-汇总模式:数据分片,多个服务器负责各个部分数据处理,最后结果汇总

二:中心调度模式: 1. 由一个节点作为中心调度管理者 2. 将任务划分为几个具体步骤 3. 管理者安排每个机器执行任务 4. 最终得到结果数据

3.MapReduce(hadoop的计算组件)(hive的底层工具)

一:利用的是分散-汇总模式

二:编程接口:map(分散)与reduce(汇总)

相关推荐
无心水31 分钟前
【任务调度:数据库锁 + 线程池实战】1、多节点抢任务?SELECT FOR UPDATE SKIP LOCKED 才是真正的无锁调度神器
人工智能·分布式·后端·微服务·架构
坂田民工1 小时前
RK3566 AB升级功能
linux·rk3566·buildroot·ab升级
SakitamaX2 小时前
LVS(Linux virual server)介绍与实验
linux·运维·lvs
小义_2 小时前
【Docker】知识八
linux·docker·云原生
开开心心_Every2 小时前
CDR版本转换工具,支持多版本互转免升级软件
linux·运维·服务器·云原生·edge·pdf·serverless
czxyvX3 小时前
009-Linux程序地址空间
linux
苏宸啊3 小时前
进程的概念
linux
yuezhilangniao3 小时前
程序人生-杂谈-简单对比一下 学霸和linux科学设计
linux·程序人生·职场和发展
只想恰口饭3 小时前
程序人生-Hello’s P2P
linux·c语言·ubuntu
hoperest3 小时前
程序人生-Hello‘s P2P
linux·c语言·程序人生·ubuntu