Spark,配置hadoop集群1

配置运行任务的历史服务器

1.配置mapred-site.xml

在hadoop的安装目录下,打开mapred-site.xml,并在该文件里面增加如下两条配置。

eg我的是在hadoop199上

复制代码
<!-- 历史服务器端地址 -->
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>hadoop100:10020</value>
</property>

<!-- 历史服务器web端地址 -->
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>hadoop100:19888</value>
</property>

添加后该文件是这样的:

2.同步配置

将此文件配置同步到其他节点中命令为:

root@hadoop100 hadoop\]$ xsync $HADOOP_HOME/etc/hadoop/mapred-site.xml #### 3.启动历史服务器 请注意:你在配置的时候指定哪个节点是历史服务器,就在哪里启动,请不要搞错了。 对应的命令是: mapred --daemon start historyserver #### 4.检查历史服务器是否启动 通过jps命令来查看历史服务器是否已经成功启动了。 \[root@hadoop100 hadoop\]$ jps 出现下图这样即代表成功启动 ![](https://i-blog.csdnimg.cn/direct/704cb60395b4435d847c2366f4522493.png) #### 5.查看JobHistory 方式1:直接去看所有的历史记录 ++++http://hadoop100:19888/jobhistory++++ 方式2:重新启动yarn服务。再从具体的history链接进行跳转。 ### 开启日志聚集功能 #### 1.配置yarn-site.xml 同样也是在hadoop100内找到yarn-site.xml文件,我们添加如下的配置。 ![](https://i-blog.csdnimg.cn/direct/80e4334fb3e14bf9b6cc1b0961466ef1.png) 在该文件里面增加如下配置。 yarn.log-aggregation-enable true yarn.log.server.url http://hadoop101:19888/jobhistory/logs yarn.log-aggregation.retain-seconds 604800 #### 2.分发配置 和之前的配置一样,我们需要把这个更新之后的yarn-site.xml文件同步到其他的机器。这里还是使用脚本xsync。具体如下: xsync /opt/module/hadoop-3.1.3/etc/hadoop/yarn-site.xml #### ****3.重启ResourceManager和HistoryServer**** 进入到我们安装yarn的主机,通过命令来关闭掉yarn和historyServer,然后再重启。 \[root@hadoop103 hadoop-3.1.3\]$ sbin/stop-yarn.sh \[root@hadoop103 hadoop-3.1.3\]$ mapred --daemon stop historyserver 启动ResourceManage和HistoryServer start-yarn.sh mapred --daemon start historyserver #### 4.测试是否运行成功 命令如下: \[root@hadoop100 hadoop-3.1.3\]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /input /output 查看日志: 如果一切正常,我们打开历史服务器地址[http://hadoop101:19888/jobhistory](http://hadoop102:19888/jobhistory "http://hadoop101:19888/jobhistory") 可以看到历史任务列表,如下: ![](https://i-blog.csdnimg.cn/direct/9b3b7b9e3f3c4533939787cceeddd4ad.png) 点击对应的JobID,就可以进一步查看任务运行日志 ![](https://i-blog.csdnimg.cn/direct/23e6891696474e1eada0ede86937eaed.png) 然后在点击logs,就可以查看运行日志的详情了。 ![](https://i-blog.csdnimg.cn/direct/8d2cef2e16754213b85af2ebba8c5a6a.png)

相关推荐
Simon_lca8 分钟前
突破合规瓶颈:ZDHC Supplier to Zero(工厂零排放 - 进阶型)体系全攻略
大数据·网络·人工智能·分类·数据挖掘·数据分析·零售
黄焖鸡能干四碗2 小时前
网络安全建设实施方案(Word文件参考下载)
大数据·网络·人工智能·安全·web安全·制造
云境筑桃源哇3 小时前
马踏春风 为爱启航 | 瑞派宠物医院(南部新城旗舰店)盛大开业!打造宠物医疗新标杆!
大数据·宠物
xixixi777774 小时前
2026 年 03 月 20 日 AI+通信+安全行业日报(来更新啦)
大数据·人工智能·安全·ai·大模型·通信
F36_9_4 小时前
大数据治理平台选型避坑:2026 年 8 大主流系统实测
大数据·数据治理
成长之路5144 小时前
【实证分析】A股上市公司企业劳动力需求数据集(2000-2023年)
大数据
奔跑的呱呱牛4 小时前
GeoJSON 在大数据场景下为什么不够用?替代方案分析
java·大数据·servlet·gis·geojson
Lab_AI4 小时前
电池材料行业数据管理新突破:AI4S驱动的科学数据平台正在重塑电池材料开发范式
大数据·人工智能·ai4s·电池材料开发·电池材料研发·电池材料创新·ai材料研发
FindAI发现力量4 小时前
智能工牌:线下销售场景的数字化赋能解决方案
大数据·人工智能·销售管理·ai销售·ai销冠·销售智能体
故事和你915 小时前
sdut-python-实验四-python序列结构(21-27)
大数据·开发语言·数据结构·python·算法