HBase面试题

描述 HBase 中 scan 和 get 的功能以及实现的异同?

HBase 的查询实现只提供两种方式:

(1)按指定 RowKey 获取唯一一条记录,get 方法(org.apache.hadoop.hbase.client.Get) Get 的方法处理分两种 : 设置了 ClosestRowBefore 和没有设置 ClosestRowBefore 的 rowlock。主要是用来保证行的事务性,即每个 get 是以一个 row 来标记的。一个 row 中 可以有很多 family 和 column。

(2)按指定的条件获取一批记录,scan 方法(org.apache.Hadoop.hbase.client.Scan)实现条 件查询功能使用的就是 scan 方式。

请详细描述 HBase 中一个 cell 的结构?

HBase 中通过 row 和 columns 确定的为一个存贮单元称为 cell。 Cell:由{row key, column(= + ), version}唯一确定的单元。cell 中的数据是 没有类型的,全部是字节码形式存贮。

简述 HBase 中 compact 用途是什么,什么时候触发,分为哪 两种,有什么区别,有哪些相关配置参数?

在 hbase 中每当有 memstore 数据 flush 到磁盘之后,就形成一个 storefile,当 storeFile 的数量达到一定程度后,就需要将 storefile 文件来进行 compaction 操作。 Compact 的作用:

① 合并文件 ② 清除过期,多余版本的数据 ③ 提高读写数据的效率 HBase 中实现了两种 compaction 的方式:minor and major.

这两种 compaction 方式的区别: 1、Minor 操作只用来做部分文件的合并操作以及包括 minVersion=0 并且设置 ttl 的过期版本清理,不做任何删除数据、多版本数据的清理工作。 2、Major 操作是对 Region 下的 HStore 下的所有 StoreFile 执行合并操作,最终 的结果是整理合并出一个文件。

相关推荐
MrTung.17 小时前
ensp VARP
网络
小五传输17 小时前
网闸怎么选?新型网闸凭安全高效,成企业优选方案
大数据·运维·安全
Boyle. Z17 小时前
校园网环境中iKuai 二级路由联网与 DNS 优化指南
网络·智能路由器
WLJT12312312318 小时前
电子元器件:智能时代的核心基石
大数据·人工智能·科技·安全·生活
AllData公司负责人18 小时前
AllData数据中台-数据同步平台集成开源项目Seatunnel-Web,完成Mysql到Doris同步流程
数据库·mysql·开源
rgeshfgreh18 小时前
Python正则与模式匹配实战技巧
大数据·人工智能
Mr.Entropy18 小时前
数据库读写分离介绍
数据库
五仁火烧18 小时前
HTTP 服务器
服务器·网络·网络协议·http
Codeking__18 小时前
Redis的value类型及编码方式介绍——string
数据库·redis·缓存
sww_102618 小时前
TCP协议
服务器·网络·tcp/ip