spark获取hadoop服务token

spark 作业一直卡在accepted

问题现象

通过yarn-cluster模式提交spark作业,客户端日志一直卡在submit app,没有运行

问题排查

1.查看yarn app日志

appid已生成,通过yarn查看app状态为等待am运行。具体查看am日志发现其一直在尝试访问hbase,尝试了36次后失败(集群hbase服务已正常停止)

问题:作业逻辑中不含hbase的相关内容,为什么会去访问hbase?

2.问题分析与原因

分析:

通过上面截图的堆栈信息查看从obtainDeletionTokens方法到HBaseDelegationTokenProvider的obtainDeletionTokens方法,说明这里是去尝试获取hbase的安全令牌。

(hbase的token获取的用户需要具有hbase:meta表的exec权限)

原因:
spark 官方文档

  • 在官网的文档描述:kerberos环境中,spark app在认证的时候,可能会获取hdfs、hive、hbase等服务的安全令牌。
  • 获取hbase的条件:hbase位于集群classpath,同时集群hbase开启了kerberos认证。
  • 所以 我们想跳过这个过程,需要提交作业时传入spark.yarn.security.credentials.hbase.enabled=false
相关推荐
建群新人小猿30 分钟前
陀螺匠企业助手-我的日程
android·大数据·运维·开发语言·容器
云和数据.ChenGuang39 分钟前
git commit复合指令
大数据·git·elasticsearch
尋有緣1 小时前
力扣614-二级关注者
大数据·数据库·sql·oracle
serve the people1 小时前
Agent 基于大模型接口实现用户意图识别:完整流程与实操
大数据·人工智能·agent
小鹿学程序1 小时前
安装Flume
大数据·flume
中科天工2 小时前
智能工厂的投资回报分析是什么?主要包含哪些关键因素?
大数据·人工智能·智能
Apache Flink2 小时前
Flink + Fluss 实战: Delta Join 原理解析与操作指南
大数据·数据库·flink
互联网江湖2 小时前
蚂蚁阿福引爆AI健康赛道,美年健康锚定AI健康智能体核心生态位
大数据·人工智能
LINGYI0002 小时前
电商代运营是怎么合作的?一般提供服务有哪些?
大数据·全域电商
无代码专家2 小时前
生产ERP解决方案:赋能制造企业精益运营与智能升级
大数据·低代码·制造