Hadoop 版本进化论:从 1.0 到 2.0,架构革命全解析

Hadoop版本

hadoop1.x版本

由三部分组成

  • Common(辅助工具)
  • HDFS(数据存储)
  • MapReduce(计算和资源调度)

存在的问题

  • JobTracker同时具备了资源管理和作业控制两个功能,成为了系统的最大瓶颈
  • 采用了master/slave结构,master存在单点问题,一旦master出现故障,会导致整个集群不可用
  • 采用了基于槽位的资源分配模型,将槽位分为了Map slot和Reduce slot两种,且不允许它们之间共享,导致一种槽位资源紧张和另一种闲置的情况

hadoop2.x版本

由四部分组成

  • Common(辅助工具)
  • HDFS(数据存储)
  • Yarn(资源调度)
  • MapReduce(计算)

yarn的出现就是为了将JobTracker的功能进行拆分为两个服务:一个全局的资源管理器ResourceManager和每个程序特有的ApplicationMaster。其中ResourceManager负责整个系统的资源管理和分配,ApplicationMaster负责单个应用程序的管理

参考文献

相关推荐
随逸1772 分钟前
《 吃透RAG:从原理到LangChain实战,彻底解决大模型幻觉问题》
后端
SimonKing6 分钟前
觅得又一款轻量级数据库管理工具:GoNavi
java·后端·程序员
小码哥_常6 分钟前
面试必知!Java线程池深度剖析
后端
Moment38 分钟前
Cursor 的 5 种指令方法比较,你最喜欢哪一种?
前端·后端·github
IT_陈寒41 分钟前
Vite快得离谱?揭秘它比Webpack快10倍的5个核心原理
前端·人工智能·后端
摸鱼的春哥1 小时前
Agent教程17:LangChain的持久化和人工干预
前端·javascript·后端
风象南2 小时前
OpenClaw 登顶 GitHub Star 榜首:一个程序员 13 年后的"重新点火"故事
人工智能·后端
Victor3562 小时前
MongoDB(25)什么是单字段索引?
后端
Victor3562 小时前
MongoDB(26)什么是复合索引?
后端
程序员爱钓鱼3 小时前
Go操作Excel实战详解:github.com/xuri/excelize/v2
前端·后端·go