hive metastore使用mysql作为backend db遇到的问题

文章目录

问题

hms使用mysql作为Backend metadata database, 但是启动爆如下错误.

bash 复制代码
Underlying cause: com.mysql.cj.jdbc.exceptions.CommunicationsException : Communications link failure

The last packet sent successfully to the server was 0 milliseconds ago. The driver has not received any packets from the server.

docker 文件

bash 复制代码
FROM docker.io/apache/hive:4.0.0
COPY ./mysql-connector-java-8.0.25.jar /opt/hive/lib/
COPY ./postgresql-42.7.3.jar /opt/hive/lib/

原生的hive不带pg以及mysql的驱动包,所以这里要自己构建镜像添加这两个包到/opt/hive/lib目录下.

docker-compose 文件

bash 复制代码
version: '3'
services:

  hms:
    image: custom_hive:latest
    ports:
      - "9083:9083"
    environment:
      SERVICE_NAME: metastore
      DB_DRIVER: mysql
      SERVICE_OPTS: -Djavax.jdo.option.ConnectionDriverName=com.mysql.cj.jdbc.Driver -Djavax.jdo.option.ConnectionURL=jdbc:mysql://metadb:3306/metastore?createDatabaseIfNotExist=true -Djavax.jdo.option.ConnectionUserName=root -Djavax.jdo.option.ConnectionPassword=abcd
    volumes:
      - warehouse:/opt/hive/data/warehouse
    links:
      - metadb
    depends_on:
      - metadb

  metadb:
    image: mysql:8.0
    container_name: metadb
    ports: 
      - "3306:3306"
    environment:
      - "MYSQL_ROOT_PASSWORD=abcd"

volumes:
  warehouse:

networks:
  default:
    name: test-net

解决

原因是连接的urljdbc:mysql://metadb:3306/metastore?createDatabaseIfNotExist=true即便有参数createDatabaseIfNotExist=true设置为true还是不能自动创建databse.所以要预先在mysql上面创建好metastore这个数据库,hms才能启动成功.

相关推荐
谷新龙0017 分钟前
大数据环境搭建指南:基于 Docker 构建 Hadoop、Hive、HBase 等服务
大数据·hadoop·docker
百度Geek说3 小时前
搜索数据建设系列之数据架构重构
数据仓库·重构·架构·spark·dubbo
爱吃面的猫6 小时前
大数据Hadoop之——Hbase下载安装部署
大数据·hadoop·hbase
王小王-1238 小时前
基于Hadoop的餐饮大数据分析系统的设计与实现
hive·hadoop·flask·sqoop·pyecharts·hadoop餐饮大数据分析·hadoop美食数据分析
大数据CLUB12 小时前
基于spark的航班价格分析预测及可视化
大数据·hadoop·分布式·数据分析·spark·数据可视化
A5资源网10 天前
为WordPress 网站创建一个纯文本网站地图(Sitemap)
前端·数据仓库·html·php
大数据CLUB10 天前
基于pyspark的北京历史天气数据分析及可视化_离线
大数据·hadoop·数据挖掘·数据分析·spark
Cachel wood10 天前
Spark教程1:Spark基础介绍
大数据·数据库·数据仓库·分布式·计算机网络·spark
張萠飛10 天前
hive集群优化和治理常见的问题答案
数据仓库·hive·hadoop
isNotNullX11 天前
ETL连接器好用吗?如何实现ETL连接?
大数据·数据库·数据仓库·信息可视化·etl