物理机搭建hive

一、修改Hadoop配置

  1. 修改core-site.xml

  2. 配置yarn-site.xml

  3. 分发文件,然后重启集群

二、 Hive解压安装

  1. 上传文件

  2. 添加hive环境便量,source生效

  3. 启动高可用集群,启动hive

三、配置mysql元数据库

  1. 检查当前系统是否安装过Mysql,如果存在就是用下列命令移除,如果不存在则忽略。(一定要做这一步)

  2. 将MySQL安装包上传到/opt/software目录下,解压MySQL安装包资源到/opt/software 下新创建的mysqljars目录

  3. 在/opt/software/mysql_jars目录下执行rpm安装,严格按照如下顺序执行

  4. 初始化数据库(这个是mysql数据库安装后的初始化),会创建mysql内部数据库和表。

    初始化前删除**/var/lib/mysql**目录下的所有内容:

    初始化

    注意:初始化遇到下面的问题说明,文件没删除,使用root用户去删干净

  5. 初始化完成后,查看临时生成的root用户的密码,也是首次登录msql的密码;启动mysql

    注意:如果启动出现下面报错,重启下mysql


  6. 修改密码,修改mysql库下的user表中的root用户允许任意ip连接并刷新,使得修改生效

  7. 配置Hive元数据库为MySql,配置Metastore到MySql

    拷贝驱动

    配置Metastore到MySql,在/opt/module/hive/conf目录下新建hive-site.xml文件(新建的配置文件中的配置会覆盖默认配置)

    <?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <configuration> <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://hadoop102:3306/metastore?useSSL=false</value> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.jdbc.Driver</value> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>root</value> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>123456</value> </property> <property> <name>hive.metastore.warehouse.dir</name> <value>/user/hive/warehouse</value> </property> <property> <name>hive.metastore.schema.verification</name> <value>false</value> </property> <property> <name>hive.metastore.event.db.notification.api.auth</name> <value>false</value> </property> </configuration>
  8. 登陆MySQL,新建Hive元数据库,初始化Hive元数据库,启动Hive


三、将Mysql做为元数据库,部署元数据服务

  1. 将hive的元数据库配置为Mysql,在hive-site.xml文件中添加如下配置信息,启动元数据服务和hive


注意:在配置了此参数后,启动hive之前必须先启动元数据服务,否则,hive启动后无法连接到元数据服务

  1. 开启Hiveserver2,在hive-site.xml文件中添加如下配置信息
  2. 重启MetaStore服务 ,启动hive服务(这里需要考虑元数据的访问方式,如何使用元数据服务的模式,需要提前开启元数据服务),启动beeline客户端(需要多等待一会,否则会报错连不上)

注意:先启动元数据服务 在启动hs2,再用工具(idea)连接hive;


相关推荐
帅次8 小时前
系统分析师-大数据处理系统分析与设计
数据仓库·elasticsearch·kafka·hbase·数据库开发·数据库架构·big data
weixin_4624462315 小时前
Hive 4.0.1 自动安装脚本详解:一键部署 + 环境变量配置(适用于 Linux)
linux·hive·hadoop
無森~15 小时前
Hive执行复杂查询报错
大数据·数据仓库·hive
無森~16 小时前
Hive SQL(进阶)
hive·hadoop·sql
【赫兹威客】浩哥16 小时前
【赫兹威客】完全分布式Hadoop测试教程
大数据·hadoop·分布式
weixin_4624462319 小时前
一键安装 Hadoop 3.3.6 自动化脚本详解 |(含 JAVA_HOME 自动配置)
java·hadoop·自动化
3分钟秒懂大数据1 天前
实时数仓实战篇一:长周期去重指标建设
大数据·数据仓库·面试·性能优化·flink
蓝眸少年CY1 天前
什么是Hadoop
大数据·hadoop·分布式
zhixingheyi_tian1 天前
Yarn 之 numa-awareness
hadoop
白日与明月1 天前
Hive 中 UNION 与 UNION ALL
hive