记一次CDH集群迁移产生的问题——HIVE

背景

生产环境CDH集群迁移到新的环境,迁移之后使用Hive Client方执行任务一直失败。

问题1:metadata.SessionHiveMetaStoreClient

产生报错:

复制代码
FAILED: SemanticException org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient

看起来是hive元数据存储有问题,所以查看了一下配置 hive-site.xml

发现没有配置用户名和密码,于是增加配置

在机器上测试执行 hive -e "show databases;"依然报一样的错。于是查看与MetaStore其他有关的配置,突然发现hive.metastore.uris配置的是迁移前的集群配置的地址,于是修改并重启。

这时候执行show databases;可以成功。

问题2:MapReduce任务卡住

本来以为没问题了,这时候,执行insert任务的时候,一直卡住

看了一下执行日志

发现没有执行reduce任务,于是再次查看配置,怀疑是分配相关的还有问题,果然就看到hive.zookeeper.quorum配置还是用的迁移前的地址....于是修改并重启。

重新执行insert代码可以正常执行了

总结

迁移集群一定要检查好配置,尤其是复制黏贴来的!!!

本次相关的配置修改:

相关推荐
早睡早起早日毕业6 小时前
大数据管理与应用系列丛书《大数据平台架构》之吃透HBase:从原理到架构的深度解剖
hadoop·hbase
b***676413 小时前
深入解析HDFS:定义、架构、原理、应用场景及常用命令
hadoop·hdfs·架构
lisw0515 小时前
社区数据仓库的可持续连接性!
大数据·数据仓库·人工智能·机器学习
howard200515 小时前
6.5 Hive查询优化:执行计划与性能初探
hive·性能优化·执行计划
大数据0015 小时前
SCD缓慢变化维Type1-Type3
hive·scd
B站计算机毕业设计之家15 小时前
电商数据实战:python京东商品爬取与可视化系统 大数据 Hadoop spark 优秀项目(源码)✅
大数据·hadoop·python·机器学习·spark·echarts·推荐算法
p***434815 小时前
后端在消息系统中的顺序保证
数据库·数据仓库·docker
e***582315 小时前
【分布式】Hadoop完全分布式的搭建(零基础)
大数据·hadoop·分布式
en-route1 天前
维度建模之星型模式(Star Schema)
数据仓库
en-route1 天前
深入理解数据仓库架构:ODS、DWD、DWS 和 ADS 层的定义与应用
大数据·数据仓库