Hive系列:Hive 整合 HBase

为何 Hive 要整合 HBase

HBase 不支持标准 SQL 语句,而且 HBase 做统计分析也不支持 Join 表操作,而这些功能是 Hive 所具备的,所以在实际的生产环境中将二者整合并让 HBase 表中的数据可以使用 Hive SQL 语句及 Join 分析是很有必要的。

整合步骤

注:进入了 hive 的 shell 命令行界面

1. 指定 hive 中 hbase 的 zookeeper 的访问路径
bash 复制代码
set hbase.zookeeper.quorum=node-01:2181,node-02:2181,node-03:2181;
2. 指定 hbase 在 zookeeper 中存储数据的节点
bash 复制代码
set zookeeper.znode.parent=/hbase;
3. 将 hive-habse 整合的 jar 包放在 hive 的 classpath 下
bash 复制代码
add jar /root/apps/hive-3.1.2/lib/hive-hbase-handler-3.1.2.jar;

整合完成:)

验证

1. 在 HBase 中建表
bash 复制代码
hbase(main):001:0> create 't_hive_hbase','base_info','extra_info'
Created table t_hive_hbase
Took 1.9468 seconds
=> Hbase::Table - t_hive_hbase

# 插入表数据
hbase(main):002:0> put 't_hive_hbase','001','base_info:name','zhangsan'
Took 2.3504 seconds
hbase(main):003:0> put 't_hive_hbase','001','base_info:age','28'
Took 0.0128 seconds
hbase(main):004:0> put 't_hive_hbase','001','extra_info:phone','13500412502'
2. 在 Hive 中建表并关联 HBase 表
bash 复制代码
create external table t_hive_hbase(rowkey string, base_info map<string, string>, extra_info map<string, string>) 
row format delimited fields terminated by '\t' 
stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
with serdeproperties ("hbase.columns.mapping" = ":key,base_info:,extra_info:") 
tblproperties ("hbase.table.name" = "t_hive_hbase");

必要的参数解释:

  • hbase.columns.mapping:指定 HBase 和 Hive 表的字段的映射关系
  • :key:获取 rowkey
  • base_info:列名:获取 base_info:列名的值,不写就是默认获取全部
  • extra_info:列名:获取 extra_info:列名的值,不写就是默认获取全部
2. 在 Hive 中执行 SQL 查询
sql 复制代码
select * from t_hive_hbase;

+----------------------+---------------------------------+--------------------------+
| t_hive_hbase.rowkey  |     t_hive_hbase.base_info      | t_hive_hbase.extra_info  |
+----------------------+---------------------------------+--------------------------+
| 001                  | {"age":"28","name":"zhangsan"}  | {"phone":"13500412502"}  |
+----------------------+---------------------------------+--------------------------+
相关推荐
無森~1 天前
HBase Java API
java·大数据·hbase
佐伊232 天前
SQL优化剧场:当Hive/MaxCompute遇上数据倾斜的十二种剧情
hive·sql优化·maxcompute·数据倾斜
Amber勇闯数分2 天前
【Hive】基于物品协同过滤 [ ItemCF ] 推荐课程-余弦相似度计算
大数据·数据仓库·hive·hadoop·矩阵
努力有什么不好2 天前
SparkSQL如何查询外部hive数据
数据仓库·hive·hadoop
yumgpkpm2 天前
华为昇腾300T A2训练、微调Qwen过程,带保姆式命令,麒麟操作系统+鲲鹏CPU
hive·hadoop·华为·flink·spark·kafka·hbase
無森~2 天前
HBase与MR、Hive整合
hive·hbase·mr
無森~2 天前
HBase优化面试题
java·面试·hbase
迎仔2 天前
11-NoSQL数据库HBase介绍:大数据世界的“快速检索图书馆”
大数据·nosql·hbase
無森~3 天前
HBase实战:通话记录分析
大数据·数据库·hbase
Gain_chance3 天前
32-学习笔记尚硅谷数仓搭建-DWD层首日数据装载脚本及每日数据装载脚本
大数据·数据仓库·hive·笔记·学习