hive metastore使用mysql作为backend db遇到的问题

文章目录

问题

hms使用mysql作为Backend metadata database, 但是启动爆如下错误.

bash 复制代码
Underlying cause: com.mysql.cj.jdbc.exceptions.CommunicationsException : Communications link failure

The last packet sent successfully to the server was 0 milliseconds ago. The driver has not received any packets from the server.

docker 文件

bash 复制代码
FROM docker.io/apache/hive:4.0.0
COPY ./mysql-connector-java-8.0.25.jar /opt/hive/lib/
COPY ./postgresql-42.7.3.jar /opt/hive/lib/

原生的hive不带pg以及mysql的驱动包,所以这里要自己构建镜像添加这两个包到/opt/hive/lib目录下.

docker-compose 文件

bash 复制代码
version: '3'
services:

  hms:
    image: custom_hive:latest
    ports:
      - "9083:9083"
    environment:
      SERVICE_NAME: metastore
      DB_DRIVER: mysql
      SERVICE_OPTS: -Djavax.jdo.option.ConnectionDriverName=com.mysql.cj.jdbc.Driver -Djavax.jdo.option.ConnectionURL=jdbc:mysql://metadb:3306/metastore?createDatabaseIfNotExist=true -Djavax.jdo.option.ConnectionUserName=root -Djavax.jdo.option.ConnectionPassword=abcd
    volumes:
      - warehouse:/opt/hive/data/warehouse
    links:
      - metadb
    depends_on:
      - metadb

  metadb:
    image: mysql:8.0
    container_name: metadb
    ports: 
      - "3306:3306"
    environment:
      - "MYSQL_ROOT_PASSWORD=abcd"

volumes:
  warehouse:

networks:
  default:
    name: test-net

解决

原因是连接的urljdbc:mysql://metadb:3306/metastore?createDatabaseIfNotExist=true即便有参数createDatabaseIfNotExist=true设置为true还是不能自动创建databse.所以要预先在mysql上面创建好metastore这个数据库,hms才能启动成功.

相关推荐
老徐电商数据笔记9 小时前
数据仓库工程师在AI时代的走向探究
数据仓库·人工智能
老徐电商数据笔记12 小时前
电商数仓存储格式(Textfile/Orc/Parquet)深度解析:五大实战方案与选型指南
大数据·数据仓库·技术面试·数据存储格式
yumgpkpm15 小时前
Cloudera CDP 7.3(国产CMP 鲲鹏版)平台与银行五大平台的技术对接方案
大数据·人工智能·hive·zookeeper·flink·kafka·cloudera
AI_567815 小时前
从“单文件存储”到“PB级集群”——HDFS如何让大数据“躺平”存储
大数据·hadoop·hdfs
潘达斯奈基~15 小时前
数仓建模1-核心框架
大数据·数据仓库
默 语2 天前
Spring Boot 3.x升级踩坑记:到底值不值得升级?
hive·spring boot·后端
ha_lydms3 天前
AnalyticDB导入MaxCompute数据的几种方式
大数据·数据仓库·阿里云·dataworks·maxcompute·odps·analyticdb
ha_lydms3 天前
2、Spark 函数_a/b/c
大数据·c语言·hive·spark·时序数据库·dataworks·数据开发
是阿威啊3 天前
【第二站】本地hadoop集群配置yarn模式
大数据·linux·hadoop·yarn
好大哥呀4 天前
Hadoop yarn
大数据·hadoop·分布式