hadoop的MapReduce

1.什么是计算(广义): 内容分析, 得到需要的结果

也就是一系列, 基于数据得出的结论。 这些就是我们所说的计算。

2.分布式计算模式:

一:分散-汇总模式:数据分片,多个服务器负责各个部分数据处理,最后结果汇总

二:中心调度模式: 1. 由一个节点作为中心调度管理者 2. 将任务划分为几个具体步骤 3. 管理者安排每个机器执行任务 4. 最终得到结果数据

3.MapReduce(hadoop的计算组件)(hive的底层工具)

一:利用的是分散-汇总模式

二:编程接口:map(分散)与reduce(汇总)

相关推荐
sbjdhjd4 分钟前
RHCE | Web 服务器与 Nginx 全栈详解
linux·nginx·http·云原生·oracle·架构·web
瑞通软件源头厂家5 分钟前
瑞通酒店管理系统:开启酒店成本控制智能新篇
大数据·人工智能
敲代码还房贷8 分钟前
FSL6.0.7安装教程
linux·ubuntu·医学生·fsl
小云数据库服务专线12 分钟前
linux awk使用
linux·运维·服务器
wangjinxun20 分钟前
LLM Xinference 安装使用(支持CPU、Metal、CUDA推理和分布式部署)
分布式
LuDvei36 分钟前
linux TCP/UDP
linux·tcp/ip·udp
杰克崔1 小时前
preempt_count()、in_interrupt()等上下文判断常用函数及宏介绍
linux·运维·服务器·车载系统
生活很暖很治愈1 小时前
Linux——TCP通信
linux·运维·tcp/ip
开开心心就好1 小时前
小巧绿色免费关机工具,支持定时倒计时
linux·运维·服务器·安全·powerpoint·1024程序员节·foxmail
搭贝1 小时前
长沙韶光芯材|精准管控工时,夯实高端制造数字化管理根基
大数据·人工智能·低代码·自动化·sass