hadoop疑难问题解决_NoClassDefFoundError: org/apache/hadoop/fs/adl/AdlFileSystem

1、问题描述

impala执行查询:select * from stmta_raw limit 10;

报错信息如下:

bash 复制代码
Query: select * from sfmta_raw limit 10
Query submitted at: 2018-04-11 14:46:29 (Coordinator: http://mrj001:25000)
ERROR: AnalysisException: Failed to load metadata for table: 'sfmta_raw'
CAUSED BY: TableLoadingException: Failed to load metadata for table: test.sfmta_raw. Running 'invalidate metadata test.sfmta_raw' may resolve this problem.
CAUSED BY: NoClassDefFoundError: org/apache/hadoop/fs/adl/AdlFileSystem
CAUSED BY: ClassNotFoundException: org.apache.hadoop.fs.adl.AdlFileSystem

2、集群环境

【操作系统】Centos6.5

【hadoop版本】2.7.1

【impala版本】2.10.0-cdh5.14.0

3、报错分析

3.1、使用日志提示解决方案

bash 复制代码
#根据日志提示执行
invalidate metadata test.sfmta_raw

3.2、检查依赖lib包依赖

bash 复制代码
#检查依赖,看是否有依赖没有引入
cd /usr/lib/impala/lib

#检查是否存在依赖包
ls -s | grep azure

3.3、检查core-site.xml配置

bash 复制代码
#进入impala配置目录
cd /etc/impala/conf

#检查配置文件
cat core-site.xml

#查看下面引入的是否有下面属性,如果没有则添加
<property>
    <name>fs.AbstractFileSystem.adl.impl</name>
    <value>org.apache.hadoop.fs.adl.Adl</value>
</property>
<property>
    <name>fs.adl.impl</name>
    <value>org.apache.hadoop.fs.adl.AdlFileSystem</value>
</property>

3.4、检查hadoop lib目录

bash 复制代码
#进入impala配置目录
cd $HADOOP_HOME/lib

#检查配置文件
ls -l | grep azure

#如果上一步有对应jar包,则查找下面jar包(该包包括缺失的class实现类)
ls -l | grep hadoop-azure-datalake

3.5、检查hadoop lib目录

如果3.2、3.3、3.4中均缺失相应jar包,则代表当前版本hadoop中不支持AdlFileSystem的实现,需要更新hadoop版本;本人使用了apache hadoop2.7.1,经过检查发现确实没有这个子类。经过hadoop官网查询验证

hadoop2.9.0版本有这个子类;问题终于找到

3.6、更新hadoop版本

检查环境兼容性,更新hadoop版本至2.9.0或更高版本

相关推荐
TDengine (老段)5 分钟前
TDengine 转化函数 TO_TIMESTAMP 用户手册
java·大数据·数据库·物联网·时序数据库·tdengine·涛思数据
LiRuiJie38 分钟前
基于Hadoop3.3.4+Flink1.17.0+FlinkCDC3.0.0+Iceberg1.5.0整合,实现数仓实时同步mysql数据
大数据·hadoop·flink·iceberg·flinkcdc
cici1587443 分钟前
Docker搭建Hadoop集群
hadoop·docker·eureka
时序数据说1 小时前
时序数据库IoTDB的优势场景分析
大数据·数据库·物联网·时序数据库·iotdb
Leo.yuan1 小时前
数据处理工具是做什么的?常见数据处理方法介绍
大数据·数据库·人工智能·python·信息可视化
阿里云大数据AI技术2 小时前
[VLDB 2025]面向云计算平台的多模态慢查询根因排序
大数据·数据库·人工智能
徐礼昭|商派软件市场负责人3 小时前
数智驱动的「库存管理」:从风险系数、ABC分类到OMS和ERP系统的协同优化策略
大数据·人工智能·分类
Guheyunyi3 小时前
安全风险监测系统是什么?内容有哪些?
大数据·人工智能·深度学习·安全·信息可视化
全知科技3 小时前
API产品升级丨全知科技发布「知影-API风险监测平台」:以AI重构企业数据接口安全治理新范式
大数据·人工智能·科技·安全
QYR_114 小时前
防水医用无人机市场报告:现状、趋势与洞察
大数据·网络·市场研究