修改jvm对象的属性值(私有)

修改jvm对象的属性值(私有)

这个想法的来源

一个spark job 在启动之后,就会确定 executor 的数量。但是存在一种情况,当我的队列资源宽松

可能就要调整一些job的资源,但是spark job在启动的时候,最大的资源就确定了,所以能否可以通过直接修改jvm

里面某些属性值来调整 job 的 资源使用大小。

通过阅读 spark on yarn 的 提交job流程代码,发现在 ApplicationMaster registerAM 方法最后

会启动一个 线程:

  1. 主要用来监控 失败 exetors 数量,失败超过一定数据之后,执行 spark stop操作
  2. 执行 allocator.allocateResources() 方法,这个方法里面会比较 executor 设定值 (targetNumExecutors) 与 当前已经分配的值,不够的话,则会
    执行申请操作
    那么如果直接增加 jvm YarnAllocator 实例的 targetNumExecutors的话, 这个spark job executor 数据就会增加。

具体操作 通过 arthas 工具操作,修改对象的私有属性值

  1. 找到 spark driver 所在的主机 执行 java -jar arthas-boot.jar

  2. 选择 对应的 进程

  3. 先找到 此对象的 classloader

    sc -d *YarnAllocator

  4. 使用 vmtool 工具 修改 私有的对象属性

    vmtool --action getInstances --className org.apache.spark.deploy.yarn.YarnAllocator //先获取到所有的实例对象
    vmtool --action getInstances --className org.apache.spark.deploy.yarn.YarnAllocator --express '#instance=instances[0]' //再拿到第一个实例对象
    vmtool --action getInstances --className org.apache.spark.deploy.yarn.YarnAllocator --express '#instance=instances[0],#fieldObj=@org.apache.spark.deploy.yarn.YarnAllocator@class.getDeclaredField("orgapachesparkdeployyarnYarnAllocatortargetNumExecutors")' //反射拿到字段 vmtool --action getInstances --className org.apache.spark.deploy.yarn.YarnAllocator --express '#instance=instances[0],#fieldObj=@org.apache.spark.deploy.yarn.YarnAllocator@class.getDeclaredField("orgapachesparkdeployyarnYarnAllocatortargetNumExecutors"),#fieldObj.setAccessible(true)' //字段设置可访问 vmtool --action getInstances --className org.apache.spark.deploy.yarn.YarnAllocator --express '#instance=instances[0],#fieldObj=@org.apache.spark.deploy.yarn.YarnAllocator@class.getDeclaredField("org$apache$spark$deploy$yarn$YarnAllocatortargetNumExecutors"),#fieldObj.setAccessible(true),#fieldObj.get(#instance)' //获取到实例的私有属性值
    vmtool --action getInstances --className org.apache.spark.deploy.yarn.YarnAllocator --express '#instance=instances[0],#fieldObj=@org.apache.spark.deploy.yarn.YarnAllocator@class.getDeclaredField("orgapachesparkdeployyarnYarnAllocator$targetNumExecutors"),#fieldObj.setAccessible(true),#fieldObj.set(#instance, 5)' //设置实例的私有属性值

注意: 有些复杂的属性不好确定,此时就需要 反编译代码了,或者使用 vmtool express 里面通过反射 打印出 所有的 Filed class.getDeclaredFields()

jad org.apache.spark.deploy.yarn.YarnAllocator //找到 targetNumExecutors 属性,可以看到并不是 targetNumExecutors,而是 orgapachesparkdeployyarnYarnAllocator$targetNumExecutors

  1. 观察 yarn web ui ,查看这个 job 的资源是不是增加了

具体操作 通过 arthas 工具操作,查看对象的静态属性值、执行静态方法

复制代码
ognl -c 279f2327 @org.apache.spark.deploy.yarn.YarnAllocator@MEM_REGEX 
ognl -c 279f2327 @org.apache.spark.deploy.yarn.YarnAllocator@MEM_REGEX() 
相关推荐
ps酷教程2 小时前
Jackson 解决没有无参构造函数的反序列化问题
java
NiceCloud喜云2 小时前
Opus 4.8 的 Effort Control 怎么选:Low 到 Max 五档策略
android·java·大数据·前端·c++·python·spring
Are_You_Okkk_3 小时前
基于MonkeyCode解析AI研发新模式,根治开发低效痛点
大数据·人工智能·开源·ai编程
_日拱一卒3 小时前
LeetCode:994腐烂的橘子
java·数据结构·算法·leetcode·深度优先
隔窗听雨眠3 小时前
Nginx网关响应慢排查手记
java·服务器·nginx
智慧物业老杨4 小时前
智慧物业合同周期管理系统:从风险预警到智能交接的全流程数智化落地方案
java·人工智能·python
科技AI训练师4 小时前
2026高压清洗泵厂家选择指南:判断标准与选购要点
大数据·人工智能
Percent_bigdata4 小时前
“模数共振”开启产业AI新阶段,重新定义数据治理
大数据·人工智能
源码宝4 小时前
MES系统源码:Java8 + SpringBoot2.7 + MySQL8 + Redis,后端源码清爽易扩展
java·后端·源码·springboot·mes系统·源码二开·mes源码
JAVA社区5 小时前
Java高级全套教程(十)—— SpringCloudAlibaba超详细实战详解
java·开发语言·spring cloud·面试·职场和发展