搭建部署Hadoop2.x和3.x的区别

文章目录

Java最小支持版本

  • Hadoop 2.x最低要求Java 7。
  • Hadoop 3.x最低要求Java 8,并且所有Hadoop JAR都已针对Java 8的运行时版本编译。这意味着用户需要升级到Java 8或更高版本才能运行Hadoop 3.x。

常用的端口号

  • NameNode (NN) 端口:
    • 在Hadoop 2.x中,NameNode的默认HTTP UI端口是50070,内部通常端口是8020/9000。
    • 在Hadoop 3.x中,这个端口被改为9870,内部通常端口是8020/9000/9820。
  • DataNode (DN) 端口:
    • Hadoop 2.x中,DataNode的默认HTTP UI端口是50075。
    • 在Hadoop 3.x中,该端口变更为9864。
  • YARN ResourceManager (RM) 端口:
    • Hadoop 2.x中的ResourceManager HTTP UI端口通常是8088。
    • 这个端口在Hadoop 3.x中保持不变,仍为8088。

配置文件

  • datanode节点信息配置文件名不同
    • hadoop2.x:slaves
    • hadoop3.x:workers
  • 其余四个文件
    • core-site.xml,hdfs-site.xml,yarn-site.xml,mapred-site.xml 文件名相同
    • 其中 yarn-site.xml 需要文件添加环境变量的继承
xml 复制代码
<!-- 环境变量的继承 -->
<property>
	<name>yarn.nodemanager.env-whitelist</name>
	<value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
</property>

Classpath隔离

在Hadoop 3.x中,通过改进类路径隔离来防止不同版本jar包之间的冲突,这在使用Hadoop、HBase和Spark等混合环境时特别有用。

NodeManager重连

Hadoop 2.x: NodeManager不会自动重连到ResourceManager。

Hadoop 3.x: NodeManager可以自动重连到ResourceManager。

在搭建和部署时,务必参考相应版本的官方文档,以确保按照最新的指南进行操作。这样可以确保系统能够充分利用新特性并保持最佳的性能和稳定性。

相关推荐
小灰灰__17 分钟前
IDEA加载通义灵码插件及使用指南
java·ide·intellij-idea
夜雨翦春韭20 分钟前
Java中的动态代理
java·开发语言·aop·动态代理
Elastic 中国社区官方博客36 分钟前
如何将数据从 AWS S3 导入到 Elastic Cloud - 第 3 部分:Elastic S3 连接器
大数据·elasticsearch·搜索引擎·云计算·全文检索·可用性测试·aws
程序媛小果41 分钟前
基于java+SpringBoot+Vue的宠物咖啡馆平台设计与实现
java·vue.js·spring boot
追风林1 小时前
mac m1 docker本地部署canal 监听mysql的binglog日志
java·docker·mac
芒果披萨1 小时前
El表达式和JSTL
java·el
Aloudata2 小时前
从Apache Atlas到Aloudata BIG,数据血缘解析有何改变?
大数据·apache·数据血缘·主动元数据·数据链路
duration~2 小时前
Maven随笔
java·maven
水豚AI课代表2 小时前
分析报告、调研报告、工作方案等的提示词
大数据·人工智能·学习·chatgpt·aigc
zmgst2 小时前
canal1.1.7使用canal-adapter进行mysql同步数据
java·数据库·mysql