大数据学习2:HIve

1.基本概念

2.Hive安装部署

1. 安装前准备

文件夹之前都创建过,就是切换到/opt/tools目录上传两个包,apache-hive-3.1.2-bin.tar.gz与mysql-5.7.34-1.el7.x86_64.rpm-bundle.tar

2. 安装MySQL

前面提到Hive允许将元数据存储于本地或远程的外部数据库中,这种设置可以支持Hive的多会话生产环境,在本案例中采用MySQL作为Hive的元数据存储库。

3.Hive安装配置

初始化成功会在mysql中创建74张表

4. 启动Hive服务

输入show databases命令可以看到默认的数据库,则代表搭建成功

3.Hive简单使用

在执行插入数据的时候,发现插入速度极慢,sql执行时间很长,花费了42秒,并且显示了MapReduce程序的进度

登录Hadoop YARN观察是否有MapReduce程序执行,地址:http://192.168.59.100:8088,需要根据自己的服务器IP进行更换

发现运行的任务名称就是所执行的SQL语句,任务的类型为MapReduce,最终状态为SUCCEEDED。

登录Hadoop HDFS浏览文件系统,根据Hive的数据模型,表的数据最终是存储在HDFS和表对应的文件夹下的。

地址:http://192.168.59.100:9870/,需要根据自己的服务器IP进行更换

相关推荐
Master_oid31 分钟前
机器学习35:元学习的应用
人工智能·学习·机器学习
想七想八不如1140844 分钟前
SQL操作学习
数据库·sql·学习
zxsz_com_cn1 小时前
设备预测性维护方案设计的关键要素
大数据·人工智能
唐天下闻化1 小时前
连锁数字化改造8成翻车?三维避坑实录
大数据
雷工笔记1 小时前
AI使用|通过AI学习物料分类编码表
笔记·学习
知识分享小能手2 小时前
Redis入门学习教程,从入门到精通, Redis Stack 完整语法知识点及使用指南(7)
数据库·redis·学习
C羊驼3 小时前
C语言学习笔记(十一):数据在内存中的存储
c语言·经验分享·笔记·学习
坚持学习前端日记3 小时前
从零开始构建小说推荐智能体 - Coze 本地部署完整教程
大数据·人工智能·数据挖掘
smchaopiao3 小时前
Hive中的排序与分桶技术详解
数据仓库·hive·hadoop