Hbase-面试题

1. Hbase-region切分

  1. 自动切分,默认情况下
    1. 2.0版本,第一次region的数据达到256M,会进行切分,以后就是每达到10G切分一次,切分完成后,会进行负载均衡,均衡到其他regionserver
  2. 预分区+自定义rowkey
    1. 可以理解为预切分
    2. 比如预分区,每个regionserver会有10个region,每个region都有startrow和endrow
    3. 生产上必须要用预分区+自定义rowkey
    4. 预分区好了之后,即使没有数据,也会新建10个region的空文件
    5. 以后存数据的时候,会均匀的存到每个region中

2. Hbase-大合并和小合并

大合并:将过期数据删除,将文件进行合并 企业中7天进行一次

小合并:将过期数据标记,但是不会删除,只会合并邻近的文件

3. Hbase-内存数据刷写

  1. 手动刷写
    1. 用命令刷写
  2. 定时刷写
  3. 设置参数
    1. MemStore达到128M
    2. 如果MemStore比较多,而且都没有达到128M,可以设置region的大小为512M

4. Hbase-二级索引

4.1. 问题

hbase查询如果过滤条件不是rowkey,就会全局遍历

举例:

如果根据name过滤,就会全局遍历

sql 复制代码
id    name    age  
1     ikun    19   

4.2. 解决

添加二级索引,其实就是再新建一个表,以name为rowkey

sql 复制代码
name  id  
ikun  1 
相关推荐
l1t几秒前
DeepSeek总结的SQL 数独:约束编程
数据库·sql
菩提祖师_1 分钟前
基于单片机指纹密码门禁的设计与实现
数据库·单片机·嵌入式硬件
福客AI智能客服5 分钟前
AI智能客服系统:增值服务行业的售后核心解决方案
大数据·人工智能
thubier(段新建)5 分钟前
2025技术实践复盘:在沉淀中打磨,在融合中锚定AI协同新方向
大数据·人工智能
在风中的意志6 分钟前
[数据库SQL] [leetcode-175] 175. 组合两个表
数据库·sql·leetcode
Hello.Reader9 分钟前
Flink Catalogs 元数据统一入口、JDBC/Hive/自定义 Catalog、Time Travel、Catalog Store 与监听器
大数据·hive·flink
Hello.Reader10 分钟前
Flink Modules 把自定义函数“伪装成内置函数”,以及 Core/Hive/自定义模块的加载与解析顺序
大数据·hive·flink
dingchengyu12 分钟前
Oracle 数据库中递归查询
数据库·oracle
在风中的意志13 分钟前
[数据库SQL] [leetcode-183] 183. 从不订购的客户
数据库·sql
档案宝档案管理15 分钟前
一键对接OA/ERP/企业微信|档案宝实现业务与档案一体化管理
大数据·数据库·人工智能·档案·档案管理