Hbase-面试题

青云游子2023-08-12 12:21

1. Hbase-region切分

自动切分，默认情况下
1. 2.0版本，第一次region的数据达到256M，会进行切分，以后就是每达到10G切分一次，切分完成后，会进行负载均衡，均衡到其他regionserver
预分区+自定义rowkey
1. 可以理解为预切分
2. 比如预分区，每个regionserver会有10个region，每个region都有startrow和endrow
3. 生产上必须要用预分区+自定义rowkey
4. 预分区好了之后，即使没有数据，也会新建10个region的空文件
5. 以后存数据的时候，会均匀的存到每个region中

2. Hbase-大合并和小合并

大合并：将过期数据删除，将文件进行合并企业中7天进行一次

小合并：将过期数据标记，但是不会删除，只会合并邻近的文件

3. Hbase-内存数据刷写

手动刷写
1. 用命令刷写
定时刷写
设置参数
1. MemStore达到128M
2. 如果MemStore比较多，而且都没有达到128M，可以设置region的大小为512M

4. Hbase-二级索引

4.1. 问题

hbase查询如果过滤条件不是rowkey，就会全局遍历

举例：

如果根据name过滤，就会全局遍历

sql 复制代码

id    name    age  
1     ikun    19

4.2. 解决

添加二级索引，其实就是再新建一个表，以name为rowkey

sql 复制代码

name  id  
ikun  1

上一篇：OOXML 基础目录

下一篇：时序预测 | MATLAB实现EEMD-GRU、GRU集合经验模态分解结合门控循环单元时间序列预测对比

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 06微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 07AI科技热点日报 | 2026年07月01日 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？092026上半年大模型全景技术解读：推理融合、Agent 爆发与多模态统一 102026 年 AI 大模型 & AI 编程工具实战全总结