Hadoop学习笔记

喝酸奶要舔盖儿2024-04-09 11:01

简介

Hadoop是一个由Apache基金会所开发的分布式系统基础架构
主要解决海量数据的存储和海量数据的分析计算问题

Hadoop组成

1. 架构

2. HDFS（Hadoop Distributed FileSystem）

简称HDFS，是一个分布式文件系统

2.1. 架构

2.1.1 NameNode(nn)

存储文件的元数据，如文件名、文件目录结构、文件属性以及每个文件的块列表和块所在的DataNode等

2.1.2 DataNode(dn)

在本地文件系统存储文件块数据，以及块数据的校验和

2.1.3 Secnday NameNode(2nn)

每隔一段时间对NameNode元数据备份

3. YARN（YetAnother Resource Negotiator）

简称YARN，另一种资源协调者，是Hadoop的资源管理器

3.1 架构

客户端可能多个
集群上可以运行多个ApplicationMaster
每个NodeManager上可以有多个Container

3.1.1 Resource Manager(RM)

管理整个集群的内存和Cpu

3.1.2 Node Manager(NM)

管理单节点的内存和Cpu

3.1.3 ApplicationMaster(AM)

单个任务运行的老大

3.1.4 Container

相当一台独立的服务器，里面封装了运行所需要的资源

4. MapReduce

4.1 架构

4.1.1 Map

4.1.2 Reduce

上一篇：工业组态物联网组态组态编辑器 web组态组态插件编辑器

下一篇：Taro打包生成不同目录

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 0300 Debian字符界面如何支持中文 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？072026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 102026 年 AI 大模型 & AI 编程工具实战全总结