设置Hadoop守护进程的JVM参数

一般情况下我们不去动守护进程的JVM,这里的守护进程说的是NameNode、DataNode等Hadoop服务自己本身的进程。但是有一些特殊情况下需要限制,比如工作中虽然集群中资源队列会有10%左右的预留空余,不过这是整个集群队列的限制,对于DataNode节点自身来说通常是限制在配置文件中的定额可跑任务总资源起到一个直观的限制,而通常DataNode节点自身的大部分资源都会分配给计算以及部分系统预留,这就导致我们在使用一些能力的时候偶发一个JVM可分配到的内存不足的问题,如下

bash 复制代码
#
# There is insufficient memory for the Java Runtime Environment to continue.
# Native memory allocation (mmap) failed to map 2684354560 bytes for committing reserved memory.
# Possible reasons:
#   The system is out of physical RAM or swap space
# Possible solutions:
#   Reduce memory load on the system
#   Increase physical memory or swap space
#   Check if swap backing store is full
#   Decrease Java heap size (-Xmx/-Xms)
#   Decrease number of Java threads
#   Decrease Java thread stack sizes (-Xss)
#   Set larger code cache with -XX:ReservedCodeCacheSize=
# This output file may be truncated or incomplete.
#
#  Out of Memory Error (os_linux.cpp:2749), pid=989550, tid=0x00007f3ff4b66700
#
# JRE version:  (8.0_202-b08) (build )
# Java VM: Java HotSpot(TM) 64-Bit Server VM (25.202-b08 mixed mode linux-amd64 )
# Core dump written. Default location: /home/work/core or core.989550

上面这个是博主工作中,某次操作hadoop ls时报了一个内存不足的OOM错误,这种时候,就需要对守护可用的内存做一些限制,限制的方法是修改hadoop-evn.sh配置文件中的HADOOP_OPTS环境变量

bash 复制代码
export HADOOP_OPTS="$HADOOP_OPTS -Xmx2g -Xms1g"

这里-Xmx2g表示设置最大堆内存为2GB,-Xms1g表示设置初始堆内存为1GB。

除了全局的HADOOP_OPTS环境变量外,Hadoop还允许你为不同的组件(如NameNode、DataNode等)单独设置JVM参数。这通常通过在hadoop-env.sh中设置特定的环境变量(如HADOOP_NAMENODE_OPTS、HADOOP_DATANODE_OPTS等)来实现。

相关推荐
2401_883041081 小时前
新锐品牌电商代运营公司都有哪些?
大数据·人工智能
青云交1 小时前
大数据新视界 -- 大数据大厂之 Impala 性能优化:融合机器学习的未来之路(上 (2-1))(11/30)
大数据·计算资源·应用案例·数据交互·impala 性能优化·机器学习融合·行业拓展
Json_181790144804 小时前
An In-depth Look into the 1688 Product Details Data API Interface
大数据·json
无尽的大道5 小时前
Java反射原理及其性能优化
jvm·性能优化
Qspace丨轻空间6 小时前
气膜场馆:推动体育文化旅游创新发展的关键力量—轻空间
大数据·人工智能·安全·生活·娱乐
Elastic 中国社区官方博客7 小时前
如何将数据从 AWS S3 导入到 Elastic Cloud - 第 3 部分:Elastic S3 连接器
大数据·elasticsearch·搜索引擎·云计算·全文检索·可用性测试·aws
Aloudata8 小时前
从Apache Atlas到Aloudata BIG,数据血缘解析有何改变?
大数据·apache·数据血缘·主动元数据·数据链路
水豚AI课代表8 小时前
分析报告、调研报告、工作方案等的提示词
大数据·人工智能·学习·chatgpt·aigc
AAA 建材批发王哥(天道酬勤)11 小时前
JVM 由多个模块组成,每个模块负责特定的功能
jvm
拓端研究室TRL11 小时前
【梯度提升专题】XGBoost、Adaboost、CatBoost预测合集:抗乳腺癌药物优化、信贷风控、比特币应用|附数据代码...
大数据