hadoop的MapReduce

1.什么是计算(广义): 内容分析, 得到需要的结果

也就是一系列, 基于数据得出的结论。 这些就是我们所说的计算。

2.分布式计算模式:

一:分散-汇总模式:数据分片,多个服务器负责各个部分数据处理,最后结果汇总

二:中心调度模式: 1. 由一个节点作为中心调度管理者 2. 将任务划分为几个具体步骤 3. 管理者安排每个机器执行任务 4. 最终得到结果数据

3.MapReduce(hadoop的计算组件)(hive的底层工具)

一:利用的是分散-汇总模式

二:编程接口:map(分散)与reduce(汇总)

相关推荐
努力努力再努力wz11 分钟前
【Linux网络系列】深入理解 I/O 多路复用:从 select 痛点到 poll 高并发服务器落地,基于 Poll、智能指针与非阻塞 I/O与线程池手写一个高性能 HTTP 服务器!(附源码)
java·linux·运维·服务器·c语言·c++·python
努力努力再努力wz13 分钟前
【Linux网络系列】万字硬核解析网络层核心:IP协议到IP 分片重组、NAT技术及 RIP/OSPF 动态路由全景
java·linux·运维·服务器·数据结构·c++·python
.千余16 分钟前
【Linux】基本指令2
linux·运维·服务器
2601_9498158419 分钟前
Linux下PostgreSQL-12.0安装部署详细步骤
linux·运维·postgresql
分布式存储与RustFS24 分钟前
Helm在Kubernetes上部署RustFS生产环境指南
分布式·零基础·picgo·对象存储·minio·rustfs
rchmin26 分钟前
Nacos配置中心避坑指南:灵活配置 server-addr 的坑
分布式·nacos·动态配置
minji...26 分钟前
Linux 线程同步与互斥(四) POSIX信号量,基于环形队列的生产者消费者模型
linux·运维·服务器·c语言·开发语言·c++
抠脚学代码40 分钟前
Linux开发-->驱动开发-->字符设备驱动框架(2)
linux·运维·驱动开发
永霖光电_UVLED44 分钟前
1.6T 光模块的能效革命
大数据·人工智能·汽车·娱乐
热爱Liunx的丘丘人1 小时前
Ansible的Playbook案例一
linux·运维·服务器·ansible