大数据学习2:HIve

1.基本概念

2.Hive安装部署

1. 安装前准备

文件夹之前都创建过,就是切换到/opt/tools目录上传两个包,apache-hive-3.1.2-bin.tar.gz与mysql-5.7.34-1.el7.x86_64.rpm-bundle.tar

2. 安装MySQL

前面提到Hive允许将元数据存储于本地或远程的外部数据库中,这种设置可以支持Hive的多会话生产环境,在本案例中采用MySQL作为Hive的元数据存储库。

3.Hive安装配置

初始化成功会在mysql中创建74张表

4. 启动Hive服务

输入show databases命令可以看到默认的数据库,则代表搭建成功

3.Hive简单使用

在执行插入数据的时候,发现插入速度极慢,sql执行时间很长,花费了42秒,并且显示了MapReduce程序的进度

登录Hadoop YARN观察是否有MapReduce程序执行,地址:http://192.168.59.100:8088,需要根据自己的服务器IP进行更换

发现运行的任务名称就是所执行的SQL语句,任务的类型为MapReduce,最终状态为SUCCEEDED。

登录Hadoop HDFS浏览文件系统,根据Hive的数据模型,表的数据最终是存储在HDFS和表对应的文件夹下的。

地址:http://192.168.59.100:9870/,需要根据自己的服务器IP进行更换

相关推荐
AhriProGramming2 分钟前
Python学习快速上手文章推荐(持续更新)
开发语言·python·学习·1024程序员节
泡泡鱼(敲代码中)15 分钟前
数据结构(顺序表和链表)
笔记·学习·算法
无妄无望28 分钟前
在没有网络的环境下安装包pymysql
学习·docker
酌量1 小时前
基于3D激光点云的障碍物检测与跟踪---(3)基于匈牙利算法的障碍物跟踪
学习·算法·机器人·匈牙利算法·障碍物跟踪
阿里云大数据AI技术1 小时前
阿里云DLF 3.0:面向AI时代的智能全模态湖仓管理平台
大数据·人工智能
白帽子凯哥哥1 小时前
SpringBoot + Elasticsearch实战:从零构建高性能搜索与数据分析平台
大数据·spring boot·后端·elasticsearch·搜索引擎·性能优化·聚合查询
电子云与长程纠缠2 小时前
Blender入门学习04 - 材质
学习·blender
文火冰糖的硅基工坊2 小时前
[人工智能-大模型-21]:“AI 编程工作流”模板(含 prompt 示例)
人工智能·科技·学习·大模型·prompt
Brianna Home2 小时前
Rust内存安全:所有权与生命周期的精妙设计
大数据·rust
讽刺人生Yan2 小时前
RFSOC学习记录(六)混频模式分析
学习·fpga·rfsoc