Hadoop运行wordcount实例任务卡在job running的多种情况及解决方法

第一种:配置问题


这是别人的图片,据楼主排查解决是因为hosts配置问题...
现象 :各种无法运行、启动
解决办法:

1、修改日志级别

export HADOOP_ROOT_LOGGER=DEBUG,console

查看下详细信息,定位到具体问题解决

第二种:服务器问题

**现象:**运行到job时卡住不动

**原因:**服务器配置低下,内存小或磁盘小

**解决办法:**修改yarn.site.xml配置

xml 复制代码
<!--每个磁盘的磁盘利用率百分比-->
<property>
    <name>yarn.nodemanager.disk-health-checker.max-disk-utilization-per-disk-percentage</name>
    <value>95.0</value>
 </property>
 <!--集群内存-->
 <property>
    <name>yarn.nodemanager.resource.memory-mb</name>
    <value>2048</value>
</property>
 <!--调度程序最小值-分配-->
<property>
   <name>yarn.scheduler.minimum-allocation-mb</name>
   <value>2048</value>
</property>
 <!--比率,具体是啥比率还没查...-->
<property>
    <name>yarn.nodemanager.vmem-pmem-ratio</name>
    <value>2.1</value>
</property>

除了服务器集群配置低,也有可能是服务器被攻击或恶意程序占用内存Hadoop的MapReduce进程卡住job/云服务器被矿工挖矿

戏剧的是,我今天还遇到一种情况...现象也是Map后卡在Job,原因是:我运行了计算圆周率程序,刚开始测试没问题后手贱执行1000次,掷10000次...Map过程还好,Job开始便无法运行...

可能是任务太大了,可以尝试换小的执行

bash 复制代码
hadoop jar ./hadoop-mapreduce-examples-2.7.3.jar pi 20 20
相关推荐
小湘西19 小时前
在 Hive 中NULL的理解
数据仓库·hive·hadoop
牛奶咖啡1320 小时前
zabbix实现监控Hadoop、Docker、SSL证书过期时间应用的保姆级实操流程
hadoop·zabbix·docker-ce引擎安装·监控docker容器·监控ssl证书的过期时间·监控hadoop·安装配置agent2
小鹿学程序1 天前
搭建hadoop集群
大数据·hadoop·分布式
John Song1 天前
用zookpeer搭建Hadoop的HA集群,组件启动的启动顺序是什么?
大数据·hadoop·debian
橙-极纪元1 天前
文件存储服务有哪些?他们优缺点分别是什么?FastDFS、MinIO、Ceph、HDFS、MooseFS、TFS、七牛云、阿里云 OSS
hdfs·minio·七牛云·tfs·fastdfs·阿里云 oss·文件存储服务
easy_coder2 天前
从HDFS NN报错看Flink+K8s+HDFS:基础、架构与问题关联
hdfs·flink·kubernetes
qq_12498707532 天前
基于hadoop的电商用户行为分析系统(源码+论文+部署+安装)
大数据·hadoop·分布式·毕业设计
临风赏月2 天前
Hadoop、Kafka、Flink、Spark、Hive五大组件运维常用操作命令
hadoop·flink·kafka
笨蛋少年派3 天前
Hive安装部署
数据仓库·hive·hadoop
罗不俷3 天前
【Hadoop】Hadoop 起源与核心组件解析 —— 大数据时代的分布式基石
大数据·hadoop·分布式