Apache Hive介绍

什么是Apache Hive

sql 复制代码
Apache Hive 是一个分布式、容错的数据仓库系统,
可实现大规模分析和 有助于使用 SQL 读取、写入和管理驻留
在分布式存储中的 PB 级数据。

什么是蜂巢

sql 复制代码
Apache Hive 是一个分布式容错数据仓库系统,可实现大规模分析。
 Hive Metastore(HMS)提供了一个中央元数据存储库,可以很容
 易地进行分析,以提供明智的信息。 数据驱动的决策,因此它是
 许多数据湖架构的关键组成部分。 Hive 建立在 Apache Hadoop 
 之上,支持通过 hdfs 在 S3、adls、gs 等上存储。 Hive 允许
 用户使用 SQL 读取、写入和管理 PB 级数据。

hiveserver2

sql 复制代码
HS2 支持多客户端并发和身份验证。 它旨在为 JDBC 和 ODBC 等开放
 API 客户端提供更好的支持。

Hive 元存储服务器 (HMS)

sql 复制代码
Hive 元存储 (HMS) 是关系数据库中 Hive 表和分区元数据的中央存储库,
 并使用元存储服务 API 为客户端(包括 Hive、Impala 和 Spark)提供对
 此信息的访问。 它已成为利用各种开源软件
 (如 Apache Spark 和 Presto)
 的数据湖的构建块。 事实上,一个完整的工具生态系统,
 无论是开源的还是其他的,都是围绕 Hive Metastore 构建的,
 这张图说明了其中的一些。

蜂巢酸

sql 复制代码
Hive 为 ORC 表提供完整的 ACID 支持,并且仅插入支持所有其他格式。

Hive 数据压缩

sql 复制代码
支持基于查询和基于 MR 的数据压缩。
sql 复制代码
## 蜂巢冰山
Hive 为 Apache Iceberg Tables 提供开箱即用的支持,
Apache Iceberg Tables 是一种云原生的 高性能开放表格式,
通过 Hive StorageHandler。

Hive 复制

sql 复制代码
Hive 支持用于备份和恢复的引导和增量复制
相关推荐
techdashen9 分钟前
dial9:给 Tokio 装上“飞行记录仪“
java·数据库·redis
城事漫游Molly10 分钟前
案例研究:如何明智地选择案例、精巧地界定边界、深刻地进行分析?
大数据·人工智能·ai写作·论文笔记
2501_9010064710 分钟前
Golang怎么用gRPC Gateway_Golang gRPC Gateway教程【经典】
jvm·数据库·python
2501_9012005311 分钟前
golang如何实现错误预算Error Budget计算_golang错误预算Error Budget计算实现实战
jvm·数据库·python
2401_8676239823 分钟前
如何解决OUI图形界面无法调用_xhost与DISPLAY变量设置
jvm·数据库·python
czlczl2002092527 分钟前
Mysql读写分离的过期读问题
数据库·mysql
LaughingZhu37 分钟前
Product Hunt 每日热榜 | 2026-05-12
大数据·人工智能·经验分享·神经网络·产品运营
2401_8246976639 分钟前
CSS如何实现元素反转特效_使用transform-scaleX(-1)操作
jvm·数据库·python
eastyuxiao1 小时前
数字孪生(Digital Twin)从入门到实战教程
大数据·人工智能·数字孪生
皮皮学姐分享-ppx1 小时前
上市公司数字技术风险暴露数据(2010-2024)|《经济研究》同款大模型测算
大数据·网络·数据库·人工智能·chatgpt·制造