hadoop_mapred-site.xml

hadoop3.2.3的高可用集群mapred-site.xml配置实例

xml 复制代码
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

	<property>
		<!-- 设置MapReduce作业使用的框架名称为YARN -->
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
  </property>

	<property>
		<!-- 设置Map任务的最大内存使用量,单位为MB -->
		<name>mapreduce.map.memory.mb</name>
		<value>9216</value>
	</property>
	
	<property>
		<!-- 设置Reduce任务的最大内存使用量,单位为MB -->
		<name>mapreduce.reduce.memory.mb</name>
		<value>18432</value>
	</property>
	
	<property>
		<!-- 设置Map任务的Java虚拟机选项,此处设置最大堆大小为4096MB -->
		<name>mapreduce.map.java.opts</name>
		<value>-Xmx4096m</value>
    </property>
	
    <property>
		<!-- 配置Reduce任务的Java虚拟机参数,设置最大堆内存为12288MB -->
		<name>mapreduce.reduce.java.opts</name>
		<value>-Xmx12288m</value>
    </property>

	<property>
		<!-- 指定MapReduce作业历史服务器的通信地址 -->
		<name>mapreduce.jobhistory.address</name>
		<value>datanode-7:10020</value>
	</property>
	
	<property>
		<!-- 设置MapReduce作业历史服务器的Web应用程序地址 -->
		<name>mapreduce.jobhistory.webapp.address</name>
		<value>datanode-7:19888</value>
	</property>
	
	<property>
		<!-- 配置第三方框架使用YARN的日志聚集功能时的日志服务器URL -->
		<name>yarn.log.server.url</name>         
		<value>http://datanode-7:19888/jobhistory/logs</value> 
	</property>
	
	<property>
		<!-- 设置MapReduce应用程序主(Application Master)的环境变量 -->
		<name>yarn.app.mapreduce.am.env</name>
		<value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
   	 </property>
	 
   	 <property>
		<!-- 设置Map任务的环境变量 -->
		<name>mapreduce.map.env</name>
		<value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
    </property>
	
   	<property>
		<!-- 设置Reduce任务的环境变量 -->
		<name>mapreduce.reduce.env</name>
		<value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
    </property>
	
	<property>
		<!-- 配置MapReduce应用程序的类路径,包含Hadoop的各种库和依赖 -->
		<name>mapreduce.application.classpath</name>
		<value>/home/hadoop/hadoop-3.2.3/etc/hadoop,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/common/lib/*,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/common/*,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/hdfs/lib/*,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/hdfs/*,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/mapreduce/lib/*,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/mapreduce/*,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/yarn/lib/*,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/yarn/*
	   </value>
 	</property>

</configuration>
相关推荐
kylezhao20191 天前
C#上位机开发数据持久化:xml数据导入导出
xml·开发语言·c#
是阿威啊2 天前
【第二站】本地hadoop集群配置yarn模式
大数据·linux·hadoop·yarn
好大哥呀2 天前
Hadoop yarn
大数据·hadoop·分布式
红队it2 天前
【数据分析】基于Spark链家网租房数据分析可视化大屏(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)✅
java·数据库·hadoop·分布式·python·数据分析·spark
arbalest10803 天前
xml文件学习
xml
本旺3 天前
【数据开发离谱场景记录】Hive + ES 复杂查询场景处理
hive·hadoop·elasticsearch
开开心心_Every3 天前
定时管理进程:防止沉迷电脑的软件推荐
xml·java·运维·服务器·网络·数据库·excel
无泪无花月隐星沉3 天前
uos server 1070e部署Hadoop
大数据·运维·服务器·hadoop·分布式·uos·国产化os
水哥ansys3 天前
ANSYS Workbench ACT二次开发XML语法介绍
xml·二次开发·水哥ansys
是阿威啊4 天前
【第一站】本地虚拟机部署Hadoop分布式集群
大数据·linux·hadoop·分布式