大数据学习2:HIve

1.基本概念

2.Hive安装部署

1. 安装前准备

文件夹之前都创建过,就是切换到/opt/tools目录上传两个包,apache-hive-3.1.2-bin.tar.gz与mysql-5.7.34-1.el7.x86_64.rpm-bundle.tar

2. 安装MySQL

前面提到Hive允许将元数据存储于本地或远程的外部数据库中,这种设置可以支持Hive的多会话生产环境,在本案例中采用MySQL作为Hive的元数据存储库。

3.Hive安装配置

初始化成功会在mysql中创建74张表

4. 启动Hive服务

输入show databases命令可以看到默认的数据库,则代表搭建成功

3.Hive简单使用

在执行插入数据的时候,发现插入速度极慢,sql执行时间很长,花费了42秒,并且显示了MapReduce程序的进度

登录Hadoop YARN观察是否有MapReduce程序执行,地址:http://192.168.59.100:8088,需要根据自己的服务器IP进行更换

发现运行的任务名称就是所执行的SQL语句,任务的类型为MapReduce,最终状态为SUCCEEDED。

登录Hadoop HDFS浏览文件系统,根据Hive的数据模型,表的数据最终是存储在HDFS和表对应的文件夹下的。

地址:http://192.168.59.100:9870/,需要根据自己的服务器IP进行更换

相关推荐
xhyyvr1 天前
解码大地的预警 —— VR地震起因及先兆学习系统
学习·vr·vr公共安全·vr公共安全体验馆·vr地震·vr地震起因先兆·vr地震模拟平台
武子康1 天前
大数据-155 Apache Druid 存储与查询架构实战:Segment/Chunk/Roll-up/Bitmap 一文讲清
大数据·后端·nosql
Amber_371 天前
php的数组和python的列表 -- 横向对比学习
python·学习·php
LBuffer1 天前
破解入门学习笔记题四十七
java·笔记·学习
可可苏饼干1 天前
TOMCAT
java·运维·学习·tomcat
p66666666681 天前
【☀Linux驱动开发笔记☀】linux下led驱动(非设备树)_03
linux·驱动开发·笔记·嵌入式硬件·学习
ITVV1 天前
计算引擎 Flink 1.19.3
大数据·flink
糖纸风筝1 天前
Java指南:eclipse、java-activemq与测试验证
java·开发语言·学习
HillVue1 天前
重估百度,也是在重估 AI 的未来
大数据·人工智能·sqlite
雷工笔记1 天前
读书笔记|算法的破坏性影响
学习·随笔