Spark,配置hadoop集群1

配置运行任务的历史服务器

1.配置mapred-site.xml

在hadoop的安装目录下,打开mapred-site.xml,并在该文件里面增加如下两条配置。

eg我的是在hadoop199上

复制代码
<!-- 历史服务器端地址 -->
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>hadoop100:10020</value>
</property>

<!-- 历史服务器web端地址 -->
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>hadoop100:19888</value>
</property>

添加后该文件是这样的:

2.同步配置

将此文件配置同步到其他节点中命令为:

root@hadoop100 hadoop\]$ xsync $HADOOP_HOME/etc/hadoop/mapred-site.xml #### 3.启动历史服务器 请注意:你在配置的时候指定哪个节点是历史服务器,就在哪里启动,请不要搞错了。 对应的命令是: mapred --daemon start historyserver #### 4.检查历史服务器是否启动 通过jps命令来查看历史服务器是否已经成功启动了。 \[root@hadoop100 hadoop\]$ jps 出现下图这样即代表成功启动 ![](https://i-blog.csdnimg.cn/direct/704cb60395b4435d847c2366f4522493.png) #### 5.查看JobHistory 方式1:直接去看所有的历史记录 ++++http://hadoop100:19888/jobhistory++++ 方式2:重新启动yarn服务。再从具体的history链接进行跳转。 ### 开启日志聚集功能 #### 1.配置yarn-site.xml 同样也是在hadoop100内找到yarn-site.xml文件,我们添加如下的配置。 ![](https://i-blog.csdnimg.cn/direct/80e4334fb3e14bf9b6cc1b0961466ef1.png) 在该文件里面增加如下配置。 yarn.log-aggregation-enable true yarn.log.server.url http://hadoop101:19888/jobhistory/logs yarn.log-aggregation.retain-seconds 604800 #### 2.分发配置 和之前的配置一样,我们需要把这个更新之后的yarn-site.xml文件同步到其他的机器。这里还是使用脚本xsync。具体如下: xsync /opt/module/hadoop-3.1.3/etc/hadoop/yarn-site.xml #### ****3.重启ResourceManager和HistoryServer**** 进入到我们安装yarn的主机,通过命令来关闭掉yarn和historyServer,然后再重启。 \[root@hadoop103 hadoop-3.1.3\]$ sbin/stop-yarn.sh \[root@hadoop103 hadoop-3.1.3\]$ mapred --daemon stop historyserver 启动ResourceManage和HistoryServer start-yarn.sh mapred --daemon start historyserver #### 4.测试是否运行成功 命令如下: \[root@hadoop100 hadoop-3.1.3\]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /input /output 查看日志: 如果一切正常,我们打开历史服务器地址[http://hadoop101:19888/jobhistory](http://hadoop102:19888/jobhistory "http://hadoop101:19888/jobhistory") 可以看到历史任务列表,如下: ![](https://i-blog.csdnimg.cn/direct/9b3b7b9e3f3c4533939787cceeddd4ad.png) 点击对应的JobID,就可以进一步查看任务运行日志 ![](https://i-blog.csdnimg.cn/direct/23e6891696474e1eada0ede86937eaed.png) 然后在点击logs,就可以查看运行日志的详情了。 ![](https://i-blog.csdnimg.cn/direct/8d2cef2e16754213b85af2ebba8c5a6a.png)

相关推荐
BizViewStudio17 分钟前
甄选方法:2026 企业新媒体代运营的短视频精细化运营与流量转化技巧
大数据·网络·人工智能·媒体
一切皆是因缘际会1 小时前
下一代 AI 架构:基于记忆演化与单向投影的安全智能系统
大数据·人工智能·深度学习·算法·安全·架构
逸Y 仙X2 小时前
文章十八:Elasticsearch 多条件组合查询实战运用
大数据·elasticsearch·搜索引擎
weixin_307779132 小时前
云计算大数据Azure服务分类详解
大数据·分类·自动化·云计算·azure
jason成都2 小时前
jetlinks社区版本扩展-TDengine
大数据·时序数据库·tdengine
久菜盒子工作室2 小时前
中国工业气体行业研究报告(2026)
大数据·人工智能
财经资讯数据_灵砚智能2 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年5月1日
大数据·人工智能·python·信息可视化·自然语言处理
weixin_446260853 小时前
应用实战篇:利用 DeepSeek V4 构建生产级 AI 应用的全流程与最佳实践
大数据·linux·人工智能
小王毕业啦13 小时前
2005-2024年 省级-总抚养比、儿童抚养比、老年人抚养比数据(xlsx)
大数据·人工智能·数据挖掘·数据分析·社科数据·实证分析·经管数据
2501_9272835814 小时前
荣联汇智助力天津艺虹打造“软硬一体”智慧工厂,全流程自动化引领印刷包装行业数智变革
大数据·运维·数据仓库·人工智能·低代码·自动化