物理机搭建hive

一、修改Hadoop配置

  1. 修改core-site.xml

  2. 配置yarn-site.xml

  3. 分发文件,然后重启集群

二、 Hive解压安装

  1. 上传文件

  2. 添加hive环境便量,source生效

  3. 启动高可用集群,启动hive

三、配置mysql元数据库

  1. 检查当前系统是否安装过Mysql,如果存在就是用下列命令移除,如果不存在则忽略。(一定要做这一步)

  2. 将MySQL安装包上传到/opt/software目录下,解压MySQL安装包资源到/opt/software 下新创建的mysqljars目录

  3. 在/opt/software/mysql_jars目录下执行rpm安装,严格按照如下顺序执行

  4. 初始化数据库(这个是mysql数据库安装后的初始化),会创建mysql内部数据库和表。

    初始化前删除**/var/lib/mysql**目录下的所有内容:

    初始化

    注意:初始化遇到下面的问题说明,文件没删除,使用root用户去删干净

  5. 初始化完成后,查看临时生成的root用户的密码,也是首次登录msql的密码;启动mysql

    注意:如果启动出现下面报错,重启下mysql


  6. 修改密码,修改mysql库下的user表中的root用户允许任意ip连接并刷新,使得修改生效

  7. 配置Hive元数据库为MySql,配置Metastore到MySql

    拷贝驱动

    配置Metastore到MySql,在/opt/module/hive/conf目录下新建hive-site.xml文件(新建的配置文件中的配置会覆盖默认配置)

    <?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <configuration> <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://hadoop102:3306/metastore?useSSL=false</value> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.jdbc.Driver</value> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>root</value> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>123456</value> </property> <property> <name>hive.metastore.warehouse.dir</name> <value>/user/hive/warehouse</value> </property> <property> <name>hive.metastore.schema.verification</name> <value>false</value> </property> <property> <name>hive.metastore.event.db.notification.api.auth</name> <value>false</value> </property> </configuration>
  8. 登陆MySQL,新建Hive元数据库,初始化Hive元数据库,启动Hive


三、将Mysql做为元数据库,部署元数据服务

  1. 将hive的元数据库配置为Mysql,在hive-site.xml文件中添加如下配置信息,启动元数据服务和hive


注意:在配置了此参数后,启动hive之前必须先启动元数据服务,否则,hive启动后无法连接到元数据服务

  1. 开启Hiveserver2,在hive-site.xml文件中添加如下配置信息
  2. 重启MetaStore服务 ,启动hive服务(这里需要考虑元数据的访问方式,如何使用元数据服务的模式,需要提前开启元数据服务),启动beeline客户端(需要多等待一会,否则会报错连不上)

注意:先启动元数据服务 在启动hs2,再用工具(idea)连接hive;


相关推荐
yumgpkpm8 小时前
CMP(类Cloudera CDP 7.3 404版华为泰山Kunpeng)和Apache Doris的对比
大数据·hive·hadoop·spark·apache·hbase·cloudera
呆呆小金人14 小时前
SQL字段对齐:性能优化与数据准确的关键
大数据·数据仓库·sql·数据库开发·etl·etl工程师
口_天_光健1 天前
制造企业的数据目录编写
大数据·数据库·数据仓库·数据分析
梦里不知身是客112 天前
spark读取table中的数据【hive】
大数据·hive·spark
DashVector2 天前
向量检索服务 DashVector产品计费
数据库·数据仓库·人工智能·算法·向量检索
yumgpkpm2 天前
Doris在CMP7(类Cloudera CDP 7 404版华为Kunpeng)启用 Kerberos部署Doris
大数据·hive·hadoop·python·oracle·flink·cloudera
Mr_Art892 天前
金融行业湖仓实践:Apache Paimon 小文件治理之道
数据仓库·金融·apache
数据牧羊人的成长笔记2 天前
Hadoop 分布式计算MapReduce和资源管理Yarn
hadoop·eclipse·mapreduce
帅次2 天前
系统分析师-案例分析-数据库系统&数据仓库&反规范化技术&NoSQL&内存数据库
大数据·数据库·数据仓库·oracle·kafka·数据库开发·数据库架构
新疆嘉博智选科技有限公司2 天前
Macos系统上搭建Hadoop详细过程
大数据·hadoop·分布式