大数据学习2:HIve

1.基本概念

2.Hive安装部署

1. 安装前准备

文件夹之前都创建过,就是切换到/opt/tools目录上传两个包,apache-hive-3.1.2-bin.tar.gz与mysql-5.7.34-1.el7.x86_64.rpm-bundle.tar

2. 安装MySQL

前面提到Hive允许将元数据存储于本地或远程的外部数据库中,这种设置可以支持Hive的多会话生产环境,在本案例中采用MySQL作为Hive的元数据存储库。

3.Hive安装配置

初始化成功会在mysql中创建74张表

4. 启动Hive服务

输入show databases命令可以看到默认的数据库,则代表搭建成功

3.Hive简单使用

在执行插入数据的时候,发现插入速度极慢,sql执行时间很长,花费了42秒,并且显示了MapReduce程序的进度

登录Hadoop YARN观察是否有MapReduce程序执行,地址:http://192.168.59.100:8088,需要根据自己的服务器IP进行更换

发现运行的任务名称就是所执行的SQL语句,任务的类型为MapReduce,最终状态为SUCCEEDED。

登录Hadoop HDFS浏览文件系统,根据Hive的数据模型,表的数据最终是存储在HDFS和表对应的文件夹下的。

地址:http://192.168.59.100:9870/,需要根据自己的服务器IP进行更换

相关推荐
charlie11451419125 分钟前
精读C++20设计模式:结构型设计模式:装饰器模式
笔记·学习·设计模式·程序设计·c++20·装饰器模式
charlie11451419127 分钟前
精读C++20设计模式——行为型设计模式:解释器模式
c++·学习·设计模式·解释器模式·c++20
lifallen28 分钟前
Flink SQL 查询 核心概念与实战指南
大数据·数据库·sql·flink
zhangxuyu111841 分钟前
flex布局学习记录
前端·css·学习
KKKlucifer1 小时前
GPT-4 赋能恶意软件 GPT-MalPro:国内首现动态生成规避检测的勒索程序技术深度解析
大数据·人工智能·gpt
中科岩创1 小时前
某机场工程道桥工程5号下穿通道基坑自动化监测
大数据·人工智能·物联网
好开心啊没烦恼1 小时前
图数据库:基于历史学科的全球历史知识图谱构建,使用Neo4j图数据库实现中国历史与全球历史的关联查询。
大数据·数据库·python·数据挖掘·数据分析·知识图谱·neo4j
下一个绝世2 小时前
免费客户管理系统推荐:适合不同行业的解决方案
大数据·人工智能
三次拒绝王俊凯3 小时前
在ideal中访问页面时出现 HTTP 404 - Not Found
java·学习·tomcat
RunningShare3 小时前
大数据消息中间件选型终极指南:深度解析Kafka、Pulsar、RocketMQ架构与性能
大数据·kafka·rocketmq·pulsar