HBase面试题

描述 HBase 中 scan 和 get 的功能以及实现的异同?

HBase 的查询实现只提供两种方式:

(1)按指定 RowKey 获取唯一一条记录,get 方法(org.apache.hadoop.hbase.client.Get) Get 的方法处理分两种 : 设置了 ClosestRowBefore 和没有设置 ClosestRowBefore 的 rowlock。主要是用来保证行的事务性,即每个 get 是以一个 row 来标记的。一个 row 中 可以有很多 family 和 column。

(2)按指定的条件获取一批记录,scan 方法(org.apache.Hadoop.hbase.client.Scan)实现条 件查询功能使用的就是 scan 方式。

请详细描述 HBase 中一个 cell 的结构?

HBase 中通过 row 和 columns 确定的为一个存贮单元称为 cell。 Cell:由{row key, column(= + ), version}唯一确定的单元。cell 中的数据是 没有类型的,全部是字节码形式存贮。

简述 HBase 中 compact 用途是什么,什么时候触发,分为哪 两种,有什么区别,有哪些相关配置参数?

在 hbase 中每当有 memstore 数据 flush 到磁盘之后,就形成一个 storefile,当 storeFile 的数量达到一定程度后,就需要将 storefile 文件来进行 compaction 操作。 Compact 的作用:

① 合并文件 ② 清除过期,多余版本的数据 ③ 提高读写数据的效率 HBase 中实现了两种 compaction 的方式:minor and major.

这两种 compaction 方式的区别: 1、Minor 操作只用来做部分文件的合并操作以及包括 minVersion=0 并且设置 ttl 的过期版本清理,不做任何删除数据、多版本数据的清理工作。 2、Major 操作是对 Region 下的 HStore 下的所有 StoreFile 执行合并操作,最终 的结果是整理合并出一个文件。

相关推荐
源远流长jerry23 分钟前
curl、ping、iptables、iperf、tcpdump解析
网络·网络协议·测试工具·ip·tcpdump
米羊12134 分钟前
OA 系统防护与渗透测试(上)
网络·安全
林疏safe39 分钟前
应急演练剧本
网络
TTBIGDATA41 分钟前
【Knox编译】xmlsectool 依赖缺失问题解析
大数据·hadoop·ambari·hdp·kerberos·knox·bigtop
天远Date Lab44 分钟前
Python实战:对接天远数据手机号码归属地API,实现精准用户分群与本地化运营
大数据·开发语言·python
@淡 定1 小时前
Redis热点Key独立集群实现方案
数据库·redis·缓存
TechubNews1 小时前
2026 年观察名单:基于 a16z「重大构想」,详解稳定币、RWA 及 AI Agent 等 8 大流行趋势
大数据·人工智能·区块链
laocooon5238578861 小时前
mysql,100个题目。
数据库·sql·mysql
Web极客码1 小时前
如何在Ubuntu服务器上安装和配置BIND9
服务器·数据库·ubuntu
W001hhh2 小时前
数据库实训Day004上午
数据库