Hive知识点

基本概念:

由Facebook开源,构建在Hadoop之上的数据仓库,数据计算是mapreduce,数据存储是HDFS

目的是构建面向分析的集成的数据环境,为企业提供决策支持

(面向分析的存储系统)

主要特征:

面向主题的,集成的,非易失的和时变的数据集合,用以支持管理决策

HIve与Hadoop的关系:

Hive需要构建在Hadoop基础上;

Hive中所有数据都存储在Hadoop分布式文件系统中;

对HQL查询语句的解释,优化,生成查询过程与由Hive合成,查询计划被转化的MapReduce任务的运行需要运行在Hadoop上

Hive的原理:

Hive是一种建立在Hadoop之上的数据仓库工具,可以使用HQL语句对数据进行分析与查询,而Hive的数据都存储在HDFS中,Hive在加载数据过程中不定时对数据进行任何修改

Hive特点:

支持索引,加快数据查询,不同的存储类型;

可以支持使用存储在Hadoop文件系统上的数据;

HQL语句最终转化为Map Reduce任务运行在Hadoop集群之上;

内质网用户自定义函数,将元数据保存在数据库上

YARN:

优点:高容错,高可用,并行安装,使用方便,版本统一更好的稳定性,更好的安全性

由MR1演化而来的资源管理系统,为上层提供统一的资源管理和调度,

在利用率,资源统一,管理与数据共享带来好处

将资源管理与作业调度两个功能分开,分别由Resource Manage与ApplicationMaster实现

相关推荐
K_i1347 小时前
Hadoop 集群自动化运维实战
运维·hadoop·自动化
Q26433650239 小时前
【有源码】基于Python与Spark的火锅店数据可视化分析系统-基于机器学习的火锅店综合竞争力评估与可视化分析-基于用户画像聚类的火锅店市场细分与可视化研究
大数据·hadoop·python·机器学习·数据分析·spark·毕业设计
想ai抽19 小时前
深入starrocks-多列联合统计一致性探查与策略(YY一下)
java·数据库·数据仓库
starfalling102420 小时前
【hive】一种高效增量表的实现
hive
顧棟1 天前
【Yarn实战】Yarn 2.9.1滚动升级到3.4.1调研与实践验证
hadoop·yarn
D明明就是我1 天前
Hive 拉链表
数据仓库·hive·hadoop
嘉禾望岗5031 天前
hive join优化和数据倾斜处理
数据仓库·hive·hadoop
yumgpkpm1 天前
华为鲲鹏 Aarch64 环境下多 Oracle 数据库汇聚操作指南 CMP(类 Cloudera CDP 7.3)
大数据·hive·hadoop·elasticsearch·zookeeper·big data·cloudera
忧郁火龙果1 天前
六、Hive的基本使用
数据仓库·hive·hadoop
忧郁火龙果1 天前
五、安装配置hive
数据仓库·hive·hadoop