Hadoop 版本进化论:从 1.0 到 2.0,架构革命全解析

Hadoop版本

hadoop1.x版本

由三部分组成

  • Common(辅助工具)
  • HDFS(数据存储)
  • MapReduce(计算和资源调度)

存在的问题

  • JobTracker同时具备了资源管理和作业控制两个功能,成为了系统的最大瓶颈
  • 采用了master/slave结构,master存在单点问题,一旦master出现故障,会导致整个集群不可用
  • 采用了基于槽位的资源分配模型,将槽位分为了Map slot和Reduce slot两种,且不允许它们之间共享,导致一种槽位资源紧张和另一种闲置的情况

hadoop2.x版本

由四部分组成

  • Common(辅助工具)
  • HDFS(数据存储)
  • Yarn(资源调度)
  • MapReduce(计算)

yarn的出现就是为了将JobTracker的功能进行拆分为两个服务:一个全局的资源管理器ResourceManager和每个程序特有的ApplicationMaster。其中ResourceManager负责整个系统的资源管理和分配,ApplicationMaster负责单个应用程序的管理

参考文献

相关推荐
快乐就是哈哈哈28 分钟前
Spring Cloud Alibaba 教程:Nacos 配置中心 + Feign 服务调用一网打尽
后端
王小王-1232 小时前
基于Hadoop的全国农产品批发价格数据分析与可视化与价格预测研究
大数据·hive·hadoop·flume·hadoop农产品价格分析·农产品批发价格·农产品价格预测
请提交用户昵称3 小时前
Spark运行架构
大数据·架构·spark
追逐时光者3 小时前
精选 5 款 .NET 开源、功能强大的工作流系统,告别重复造轮子!
后端·.net
bobz9654 小时前
Agent AI:多模态交互前沿调查
后端
小厂永远得不到的男人4 小时前
一篇文章搞懂 java 反射
java·后端
蒋星熠4 小时前
Rust 异步生态实战:Tokio 调度、Pin/Unpin 与零拷贝 I/O
人工智能·后端·python·深度学习·rust
公众号_醉鱼Java4 小时前
Elasticsearch文档数迷思:深度解析count与stats背后机制
后端
David爱编程4 小时前
Java 编译期 vs 运行期:避开这些坑,少掉一半 Bug
java·后端
麦兜*5 小时前
Spring Boot调用优化版AI推理微服务 集成 NVIDIA NIM指南
java·人工智能·spring boot·后端·spring cloud·微服务·ai编程