复习打卡大数据篇——Apache Hadoop

1. Hadoop简介

Hadoop概念:

Hadoop是一个分布式系统基础架构,主要是为了解决海量数据的存储和海量数据的分析计算问题。组件包括:HDFS,是一个具有高可靠性、高吞吐量的分布式文件系统,用于数据存储;MapReduce用于处理业务逻辑运算;YARN负责作业调度与集群资源管理。

Hadoop特性:

  • **扩容能力:**Hadoop是在可用的计算机集群间分配数据并完成计算任务的,这些集群可用方便的扩展到数以千计的节点中。
  • **成本低:**Hadoop通过普通廉价的机器组成服务器集群来分发以及处理数据,以至于成本很低。
  • **高效率:**通过并发数据,Hadoop可以在节点之间动态并行的移动数据,使得速度非常快。
  • **可靠性:**能自动维护数据的多份复制,并且在任务失败后能自动地重新部署(redeploy)计算任务。所以Hadoop的按位存储和处理数据的能力值得人们信赖。

Hadoop集群简介:

HADOOP集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起。

HDFS集群:解决了海量数据存储 分布式存储系统

  • 主角色:namenode(NN)
  • 从角色:datanode(DN)
  • 主角色辅助角色"秘书角色":secondarynamenode (SNN)

YARN集群:集群资源管理 任务调度

  • 主角色:resourcemanager(RM)
  • 从角色:nodemanager(NM)

Hadoop部署模式:

  • **Standalone mode(独立模式):**又称为单机模式,仅1个机器运行1个java进程,主要用于调试。
  • **Pseudo-Distributed mode(伪分布式模式):**也是在1个机器上运行HDFS的NameNode和DataNode、YARN的 ResourceManger和NodeManager,但分别启动单独的java进程,主要用于调试。
  • **Cluster mode(集群模式):**集群模式主要用于生产环境部署。会使用N台主机组成一个Hadoop集群。这种部署模式下,主节点和从节点会分开部署在不同的机器上。
  • **高可用(持续可用)集群 HA :**在分布式的模式下给主角色设置备份角色,实现了容错的功能 解决了单点故障,保证集群持续可用性。

集群webUI:

一旦Hadoop集群启动并运行,可以通过web-ui进行集群查看:

  • NameNode http://nn_host:port/ 默认9870
  • ResourceManager http://rm_host:port/ 默认 8088
  • jobhistoryserver 默认 19888
相关推荐
夕除11 小时前
javaweb--04
数据仓库·hive·hadoop
Me4神秘1 天前
国家级互联网骨干直联点及容量、互联网交换中心
大数据·信息与通信
zandy10111 天前
全链路可控+极致性能,衡石HENGSHI CLI重新定义企业级BI工具的AI协作能力
大数据·人工智能·ai analytics·ai native·agent-first
果粒蹬i1 天前
Elasticsearch 单机部署实测:安装流程、常见坑点与远程访问配置
大数据·elasticsearch·搜索引擎
AC赳赳老秦1 天前
OpenClaw数据库高效操作指南:MySQL/PostgreSQL批量处理与数据迁移实战
大数据·数据库·mysql·elasticsearch·postgresql·deepseek·openclaw
小王毕业啦1 天前
2006-2023年 省级-建成区绿化覆盖率数据(xlsx)
大数据·人工智能·数据挖掘·数据分析·社科数据·实证分析·经管数据
AEIC学术交流中心1 天前
【快速EI检索 | SPIE出版】第六届中国膜计算论坛暨2026年人工智能、大数据与电气自动化国际学术会议(CWMC&AIBDE 2026)
大数据·人工智能·量子计算
历程里程碑1 天前
二叉树---二叉树的中序遍历
java·大数据·开发语言·elasticsearch·链表·搜索引擎·lua
AC赳赳老秦1 天前
OpenClaw text-translate技能:多语言批量翻译,解决跨境工作沟通难题
大数据·运维·数据库·人工智能·python·deepseek·openclaw
Elastic 中国社区官方博客1 天前
使用 Elasticsearch + Jina embeddings 进行无监督文档聚类
大数据·人工智能·elasticsearch·搜索引擎·全文检索·jina