1 Hadoop入门

1.Hadoop是什么?

(1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

(2)主要解决,海量数据的存储和海量数据的分析计算问题。

(3)广义上来说,Hadoop通常是指一个更广泛的概念------Hadoop生态圈

2.Hadoop的优势


3 Hadoop组成

4 HDFS概述

5 YARN架构概述

Yet Another Resource Negotiator 简称 YARN ,另一种资源协调者,是 Hadoop 的资源管理器。

yarn主要管理的是整个集群的内存和cpu

ApplicationManager运行在Container(容器)上,容器是一种虚拟化的技术,类似阿里云的容器虚拟技术,不会是真正的无数台服务器.

6 MapReduce架构概述

负责hadoop中的计算部分

7 HDFS、YARN、MapReduce 三者关系

相关推荐
AAA修煤气灶刘哥2 小时前
别让Redis「歪脖子」!一次搞定数据倾斜与请求倾斜的捉妖记
redis·分布式·后端
阿里云大数据AI技术6 小时前
大数据公有云市场第一,阿里云占比47%!
大数据
Lx35210 小时前
Hadoop容错机制深度解析:保障作业稳定运行
大数据·hadoop
Aomnitrix14 小时前
知识管理新范式——cpolar+Wiki.js打造企业级分布式知识库
开发语言·javascript·分布式
程序消消乐14 小时前
Kafka 入门指南:从 0 到 1 构建你的 Kafka 知识基础入门体系
分布式·kafka
智能化咨询14 小时前
Kafka架构:构建高吞吐量分布式消息系统的艺术——进阶优化与行业实践
分布式·架构·kafka
Chasing__Dreams14 小时前
kafka--基础知识点--5.2--最多一次、至少一次、精确一次
分布式·kafka
T062051415 小时前
工具变量-5G试点城市DID数据(2014-2025年
大数据
向往鹰的翱翔15 小时前
BKY莱德因:5大黑科技逆转时光
大数据·人工智能·科技·生活·健康医疗