Hadoop运行wordcount实例任务卡在job running的多种情况及解决方法

第一种:配置问题


这是别人的图片,据楼主排查解决是因为hosts配置问题...
现象 :各种无法运行、启动
解决办法:

1、修改日志级别

export HADOOP_ROOT_LOGGER=DEBUG,console

查看下详细信息,定位到具体问题解决

第二种:服务器问题

**现象:**运行到job时卡住不动

**原因:**服务器配置低下,内存小或磁盘小

**解决办法:**修改yarn.site.xml配置

xml 复制代码
<!--每个磁盘的磁盘利用率百分比-->
<property>
    <name>yarn.nodemanager.disk-health-checker.max-disk-utilization-per-disk-percentage</name>
    <value>95.0</value>
 </property>
 <!--集群内存-->
 <property>
    <name>yarn.nodemanager.resource.memory-mb</name>
    <value>2048</value>
</property>
 <!--调度程序最小值-分配-->
<property>
   <name>yarn.scheduler.minimum-allocation-mb</name>
   <value>2048</value>
</property>
 <!--比率,具体是啥比率还没查...-->
<property>
    <name>yarn.nodemanager.vmem-pmem-ratio</name>
    <value>2.1</value>
</property>

除了服务器集群配置低,也有可能是服务器被攻击或恶意程序占用内存Hadoop的MapReduce进程卡住job/云服务器被矿工挖矿

戏剧的是,我今天还遇到一种情况...现象也是Map后卡在Job,原因是:我运行了计算圆周率程序,刚开始测试没问题后手贱执行1000次,掷10000次...Map过程还好,Job开始便无法运行...

可能是任务太大了,可以尝试换小的执行

bash 复制代码
hadoop jar ./hadoop-mapreduce-examples-2.7.3.jar pi 20 20
相关推荐
爱吃大芒果21 小时前
Flutter 本地存储方案:SharedPreferences、SQFlite 与 Hive
开发语言·javascript·hive·hadoop·flutter·华为·harmonyos
shjita1 天前
hadoop运行jar包的相关配置参考!
大数据·hadoop·分布式
yumgpkpm1 天前
AI大模型手机的“简单替换陷阱”与Hadoop、Cloudera CDP 7大数据底座的关系探析
大数据·人工智能·hadoop·华为·spark·kafka·cloudera
yumgpkpm1 天前
Cloudera CDP 7.3下载地址、方式,开源适配 CMP 7.3(或类 CDP 的 CMP 7.13 平台,如华为鲲鹏 ARM 版)值得推荐
大数据·hive·hadoop·分布式·华为·开源·cloudera
云老大TG:@yunlaoda3602 天前
跨境电商行业适合使用腾讯云国际站代理商的MapReduce吗?
云计算·腾讯云·mapreduce
yumgpkpm2 天前
hadoop集群搭建 (超详细) 接入Impala、Hive,AI 大模型的数据底座
hive·hadoop·mysql·zookeeper·flink·kafka·hbase
励志成为糕手2 天前
MapReduce工作流程:从MapTask到Yarn机制深度解析
大数据·hadoop·分布式·mapreduce·yarn
TG:@yunlaoda360 云老大2 天前
腾讯云国际站代理商的MapReduce在处理跨境电商行业数据时的具体性能表现如何?
云计算·腾讯云·mapreduce
TG:@yunlaoda360 云老大2 天前
腾讯云国际站代理商的MapReduce适合哪些跨境业务场景?
云计算·腾讯云·mapreduce
编织幻境的妖2 天前
Hadoop核心组件及其作用概述
大数据·hadoop·分布式