Hadoop 版本进化论:从 1.0 到 2.0,架构革命全解析

Hadoop版本

hadoop1.x版本

由三部分组成

  • Common(辅助工具)
  • HDFS(数据存储)
  • MapReduce(计算和资源调度)

存在的问题

  • JobTracker同时具备了资源管理和作业控制两个功能,成为了系统的最大瓶颈
  • 采用了master/slave结构,master存在单点问题,一旦master出现故障,会导致整个集群不可用
  • 采用了基于槽位的资源分配模型,将槽位分为了Map slot和Reduce slot两种,且不允许它们之间共享,导致一种槽位资源紧张和另一种闲置的情况

hadoop2.x版本

由四部分组成

  • Common(辅助工具)
  • HDFS(数据存储)
  • Yarn(资源调度)
  • MapReduce(计算)

yarn的出现就是为了将JobTracker的功能进行拆分为两个服务:一个全局的资源管理器ResourceManager和每个程序特有的ApplicationMaster。其中ResourceManager负责整个系统的资源管理和分配,ApplicationMaster负责单个应用程序的管理

参考文献

相关推荐
倚栏听风雨21 分钟前
IDEA 插件开发 plugin.xml 中 <depends config-file=".xml" optional="true"> 详解
后端
惜鸟39 分钟前
Spring Boot项目自己封装一个分页查询工具
spring boot·后端
Dithyrambus39 分钟前
ObjectScript 中文入门教程
后端
林太白1 小时前
也许看了Electron你会理解Tauri,扩宽你的技术栈
前端·后端·electron
松果集1 小时前
【Python3】练习一
后端
anganing1 小时前
Web 浏览器预览 Excel 及打印
前端·后端
肯定慧1 小时前
B1-基于大模型的智能办公应用软件
后端
TinyKing1 小时前
一、getByRole 的作用
后端
brzhang2 小时前
我们复盘了100个失败的AI Agent项目,总结出这3个“必踩的坑”
前端·后端·架构