大数据学习2:HIve

1.基本概念

2.Hive安装部署

1. 安装前准备

文件夹之前都创建过,就是切换到/opt/tools目录上传两个包,apache-hive-3.1.2-bin.tar.gz与mysql-5.7.34-1.el7.x86_64.rpm-bundle.tar

2. 安装MySQL

前面提到Hive允许将元数据存储于本地或远程的外部数据库中,这种设置可以支持Hive的多会话生产环境,在本案例中采用MySQL作为Hive的元数据存储库。

3.Hive安装配置

初始化成功会在mysql中创建74张表

4. 启动Hive服务

输入show databases命令可以看到默认的数据库,则代表搭建成功

3.Hive简单使用

在执行插入数据的时候,发现插入速度极慢,sql执行时间很长,花费了42秒,并且显示了MapReduce程序的进度

登录Hadoop YARN观察是否有MapReduce程序执行,地址:http://192.168.59.100:8088,需要根据自己的服务器IP进行更换

发现运行的任务名称就是所执行的SQL语句,任务的类型为MapReduce,最终状态为SUCCEEDED。

登录Hadoop HDFS浏览文件系统,根据Hive的数据模型,表的数据最终是存储在HDFS和表对应的文件夹下的。

地址:http://192.168.59.100:9870/,需要根据自己的服务器IP进行更换

相关推荐
米羊1216 分钟前
已有安全措施确认(上)
大数据·网络
Gary Studio34 分钟前
rk芯片驱动编写
linux·学习
mango_mangojuice36 分钟前
Linux学习笔记(make/Makefile)1.23
java·linux·前端·笔记·学习
lingggggaaaa1 小时前
安全工具篇&动态绕过&DumpLsass凭据&Certutil下载&变异替换&打乱源头特征
学习·安全·web安全·免杀对抗
PP东1 小时前
Flowable学习(二)——Flowable概念学习
java·后端·学习·flowable
学电子她就能回来吗1 小时前
深度学习速成:损失函数与反向传播
人工智能·深度学习·学习·计算机视觉·github
人道领域1 小时前
AI抢人大战:谁在收割你的红包
大数据·人工智能·算法
qq_12498707532 小时前
基于Hadoop的信贷风险评估的数据可视化分析与预测系统的设计与实现(源码+论文+部署+安装)
大数据·人工智能·hadoop·分布式·信息可视化·毕业设计·计算机毕业设计
Hello.Reader2 小时前
Flink 使用 Amazon S3 读写、Checkpoint、插件选择与性能优化
大数据·flink
零售ERP菜鸟2 小时前
范式革命:从“信息化”到“数字化”的本质跃迁
大数据·人工智能·职场和发展·创业创新·学习方法·业界资讯