1 Hadoop入门

水无痕simon2023-08-26 13:49

1.Hadoop是什么？

(1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

(2)主要解决，海量数据的存储和海量数据的分析计算问题。

(3)广义上来说，Hadoop通常是指一个更广泛的概念------Hadoop生态圈

2.Hadoop的优势

3 Hadoop组成

4 HDFS概述

5 YARN架构概述

Yet Another Resource Negotiator 简称 YARN ，另一种资源协调者，是 Hadoop 的资源管理器。

yarn主要管理的是整个集群的内存和cpu

ApplicationManager运行在Container(容器)上，容器是一种虚拟化的技术，类似阿里云的容器虚拟技术，不会是真正的无数台服务器.

6 MapReduce架构概述

负责hadoop中的计算部分

7 HDFS、YARN、MapReduce 三者关系

上一篇：论文阅读_图形图像_U-NET

下一篇：Docker微服务实战

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 06微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 07AI科技热点日报 | 2026年07月01日 082026上半年大模型全景技术解读：推理融合、Agent 爆发与多模态统一 092026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？102026 年 AI 大模型 & AI 编程工具实战全总结