Hadoop学习笔记

视频地址

简介

  1. Hadoop是一个由Apache基金会所开发的分布式系统基础架构
  2. 主要解决海量数据的存储和海量数据的分析计算问题

Hadoop组成

1. 架构

2. HDFS(Hadoop Distributed FileSystem)

简称HDFS,是一个分布式文件系统

2.1. 架构

2.1.1 NameNode(nn)

存储文件的元数据,如文件名文件目录结构文件属性以及每个文件的块列表块所在的DataNode

2.1.2 DataNode(dn)

在本地文件系统存储文件块数据,以及块数据的校验和

2.1.3 Secnday NameNode(2nn)

每隔一段时间对NameNode元数据备份

3. YARN(YetAnother Resource Negotiator)

简称YARN,另一种资源协调者,是Hadoop的资源管理器

3.1 架构

  1. 客户端可能多个
  2. 集群上可以运行多个ApplicationMaster
  3. 每个NodeManager上可以有多个Container
3.1.1 Resource Manager(RM)

管理整个集群的内存和Cpu

3.1.2 Node Manager(NM)

管理单节点的内存和Cpu

3.1.3 ApplicationMaster(AM)

单个任务运行的老大

3.1.4 Container

相当一台独立的服务器,里面封装了运行所需要的资源

4. MapReduce

4.1 架构

4.1.1 Map
4.1.2 Reduce
相关推荐
二宝哥8 小时前
大数据之安装Hadoop3.1.4
大数据·hadoop
Irene19919 小时前
Windows 11 WSL Ubuntu 环境:安装 Hadoop 完整指南
hadoop·ubuntu
Irene19919 小时前
(课堂笔记)Hive 基础
hive·hadoop
nassi_20 小时前
对AI工程问题的一些思考
大数据·人工智能·hadoop
Irene19911 天前
(课堂笔记)hadoop 基础使用
hadoop
水火既济__1 天前
加快hive效率
数据仓库·hive·hadoop
lifewange3 天前
Hive 数据库 增删改 完整操作指南
数据库·hive·hadoop
WL_Aurora3 天前
Sqoop数据迁移工具从入门到精通
hive·hadoop·sqoop
蜀道山老天师3 天前
Prometheus监控Hadoop集群(实操完整版,含避坑指南)
大数据·linux·运维·hadoop·云原生·prometheus
极光代码工作室4 天前
基于大数据的交通流量分析系统
大数据·hadoop·python·数据分析·数据可视化