hadoop_mapred-site.xml

hadoop3.2.3的高可用集群mapred-site.xml配置实例

xml 复制代码
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

	<property>
		<!-- 设置MapReduce作业使用的框架名称为YARN -->
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
  </property>

	<property>
		<!-- 设置Map任务的最大内存使用量,单位为MB -->
		<name>mapreduce.map.memory.mb</name>
		<value>9216</value>
	</property>
	
	<property>
		<!-- 设置Reduce任务的最大内存使用量,单位为MB -->
		<name>mapreduce.reduce.memory.mb</name>
		<value>18432</value>
	</property>
	
	<property>
		<!-- 设置Map任务的Java虚拟机选项,此处设置最大堆大小为4096MB -->
		<name>mapreduce.map.java.opts</name>
		<value>-Xmx4096m</value>
    </property>
	
    <property>
		<!-- 配置Reduce任务的Java虚拟机参数,设置最大堆内存为12288MB -->
		<name>mapreduce.reduce.java.opts</name>
		<value>-Xmx12288m</value>
    </property>

	<property>
		<!-- 指定MapReduce作业历史服务器的通信地址 -->
		<name>mapreduce.jobhistory.address</name>
		<value>datanode-7:10020</value>
	</property>
	
	<property>
		<!-- 设置MapReduce作业历史服务器的Web应用程序地址 -->
		<name>mapreduce.jobhistory.webapp.address</name>
		<value>datanode-7:19888</value>
	</property>
	
	<property>
		<!-- 配置第三方框架使用YARN的日志聚集功能时的日志服务器URL -->
		<name>yarn.log.server.url</name>         
		<value>http://datanode-7:19888/jobhistory/logs</value> 
	</property>
	
	<property>
		<!-- 设置MapReduce应用程序主(Application Master)的环境变量 -->
		<name>yarn.app.mapreduce.am.env</name>
		<value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
   	 </property>
	 
   	 <property>
		<!-- 设置Map任务的环境变量 -->
		<name>mapreduce.map.env</name>
		<value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
    </property>
	
   	<property>
		<!-- 设置Reduce任务的环境变量 -->
		<name>mapreduce.reduce.env</name>
		<value>HADOOP_MAPRED_HOME=${HADOOP_HOME}</value>
    </property>
	
	<property>
		<!-- 配置MapReduce应用程序的类路径,包含Hadoop的各种库和依赖 -->
		<name>mapreduce.application.classpath</name>
		<value>/home/hadoop/hadoop-3.2.3/etc/hadoop,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/common/lib/*,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/common/*,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/hdfs/lib/*,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/hdfs/*,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/mapreduce/lib/*,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/mapreduce/*,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/yarn/lib/*,
			   /home/hadoop/hadoop-3.2.3/share/hadoop/yarn/*
	   </value>
 	</property>

</configuration>
相关推荐
计算机毕业编程指导师17 小时前
【计算机毕设推荐】Python+Spark卵巢癌风险数据可视化系统完整实现 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘
hadoop·python·计算机·数据挖掘·spark·毕业设计·卵巢癌
极光代码工作室18 小时前
基于大数据的校园消费行为分析系统
大数据·hadoop·python·数据分析·spark
hhb_61819 小时前
XML数据解析与节点配置实操案例教程
xml
WL_Aurora2 天前
MapReduce经典例题【第二期】
大数据·mapreduce
二十六画生的博客2 天前
每个subtask都提交一份快照到hdfs,会把10个小的快照合并成一个大的吗?谁来合并?
大数据·hadoop·hdfs·flink
千月落2 天前
HDFS数据迁移
大数据·hadoop·hdfs
隐于花海,等待花开3 天前
40.RAND 函数深度解析
hive·hadoop
WL_Aurora4 天前
MapReduce经典例题【第一期】
大数据·mapreduce
隐于花海,等待花开4 天前
39.ROUND / FLOOR / CEIL 函数深度解析
hive·hadoop
坚持就完事了5 天前
YARN资源管理器
大数据·linux·hadoop·学习