大数据学习2:HIve

1.基本概念

2.Hive安装部署

1. 安装前准备

文件夹之前都创建过,就是切换到/opt/tools目录上传两个包,apache-hive-3.1.2-bin.tar.gz与mysql-5.7.34-1.el7.x86_64.rpm-bundle.tar

2. 安装MySQL

前面提到Hive允许将元数据存储于本地或远程的外部数据库中,这种设置可以支持Hive的多会话生产环境,在本案例中采用MySQL作为Hive的元数据存储库。

3.Hive安装配置

初始化成功会在mysql中创建74张表

4. 启动Hive服务

输入show databases命令可以看到默认的数据库,则代表搭建成功

3.Hive简单使用

在执行插入数据的时候,发现插入速度极慢,sql执行时间很长,花费了42秒,并且显示了MapReduce程序的进度

登录Hadoop YARN观察是否有MapReduce程序执行,地址:http://192.168.59.100:8088,需要根据自己的服务器IP进行更换

发现运行的任务名称就是所执行的SQL语句,任务的类型为MapReduce,最终状态为SUCCEEDED。

登录Hadoop HDFS浏览文件系统,根据Hive的数据模型,表的数据最终是存储在HDFS和表对应的文件夹下的。

地址:http://192.168.59.100:9870/,需要根据自己的服务器IP进行更换

相关推荐
大苏打seven1 小时前
Docker学习笔记:Docker网络
笔记·学习·docker
诗旸的技术记录与分享1 小时前
Flink-1.19.0源码详解-番外补充3-StreamGraph图
大数据·flink
资讯分享周1 小时前
Alpha系统联结大数据、GPT两大功能,助力律所管理降本增效
大数据·gpt
Green1Leaves2 小时前
pytorch学习-9.多分类问题
人工智能·pytorch·学习
G皮T3 小时前
【Elasticsearch】深度分页及其替代方案
大数据·elasticsearch·搜索引擎·scroll·检索·深度分页·search_after
慕y2743 小时前
Java学习第十五部分——MyBatis
java·学习·mybatis
TDengine (老段)3 小时前
TDengine STMT2 API 使用指南
java·大数据·物联网·时序数据库·iot·tdengine·涛思数据
碣石潇湘无限路4 小时前
【AI篇】当Transformer模型开始学习《孙子兵法》
人工智能·学习
用户Taobaoapi20145 小时前
母婴用品社媒种草效果量化:淘宝详情API+私域转化追踪案例
大数据·数据挖掘·数据分析
future14125 小时前
C#每日学习日记
java·学习·c#