hadoop的MapReduce

1.什么是计算(广义): 内容分析, 得到需要的结果

也就是一系列, 基于数据得出的结论。 这些就是我们所说的计算。

2.分布式计算模式:

一:分散-汇总模式:数据分片,多个服务器负责各个部分数据处理,最后结果汇总

二:中心调度模式: 1. 由一个节点作为中心调度管理者 2. 将任务划分为几个具体步骤 3. 管理者安排每个机器执行任务 4. 最终得到结果数据

3.MapReduce(hadoop的计算组件)(hive的底层工具)

一:利用的是分散-汇总模式

二:编程接口:map(分散)与reduce(汇总)

相关推荐
阿里云大数据AI技术10 小时前
StarRocks 助力数禾科技构建实时数仓:从数据孤岛到智能决策
大数据
CYRUS_STUDIO14 小时前
用 Frida 控制 Android 线程:kill 命令、挂起与恢复全解析
android·linux·逆向
Lx35214 小时前
Hadoop数据处理优化:减少Shuffle阶段的性能损耗
大数据·hadoop
熊猫李16 小时前
rootfs-根文件系统详解
linux
努力的小郑17 小时前
从一次分表实践谈起:我们真的需要复杂的分布式ID吗?
分布式·后端·面试
dessler18 小时前
Hadoop HDFS-高可用集群部署
linux·运维·hdfs
泽泽爱旅行18 小时前
awk 语法解析-前端学习
linux·前端
武子康18 小时前
大数据-99 Spark Streaming 数据源全面总结:原理、应用 文件流、Socket、RDD队列流
大数据·后端·spark
AAA修煤气灶刘哥1 天前
别让Redis「歪脖子」!一次搞定数据倾斜与请求倾斜的捉妖记
redis·分布式·后端
阿里云大数据AI技术1 天前
大数据公有云市场第一,阿里云占比47%!
大数据