HBase snapshot+replication 测试

一、背景

画像标签服务(CDP)是核心服务,被公司其他系统如现金、电商、风控等核心业务调用。异常的话,影响范围大。

二、目标

存量数据测试通过 snapshot 迁移。增量数据测试通过 replication 同步。

三、测试

方案二测试,两个独立HBase集群,snapshot+replication

(1)存量数据迁移 (snapshot)

1、同步数据到目标hbase集群

shell 复制代码
hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot \
-snapshot test_20240315_1 \
-copy-from hdfs://10.9.21.38:8020/hbase \
-copy-to hdfs://10.9.21.38:8020/hbase_new \
-mappers 1 \
-bandwidth 128


以上命令产生的 Yarn 任务:

2、在目标hbase集群上查询数据

shell 复制代码
restore_snapshot 'test_20240315_1'
scan 'test'

(2)增量数据同步 (replication)

1、原集群上执行。增加从集群。

shell 复制代码
add_peer '1', CLUSTER_KEY => "10.9.109.203:2181:/hbase_new"
list_peers

2、原集群上执行。修改表属性,设置复制目标从集群。

shell 复制代码
alter 't2024',{NAME => 'cf1' , REPLICATION_SCOPE=>'1'}

3、原集群上执行。写入数据。

4、从集群上执行。从集群确认数据同步成功。

相关推荐
青主创享阁10 分钟前
玄晶引擎XgenCore Works V2.8.1升级解析 技术迭代赋能场景 代理模式全新落地
大数据·人工智能·代理模式
七夜zippoe11 分钟前
MongoDB聚合框架与性能优化实战指南
数据库·python·mongodb·性能优化·聚合框架
聆风吟º1 小时前
金仓数据库 SQL 防火墙:内核级防护,筑牢 SQL 注入安全防线
数据库·sql·安全·金仓·kingbasees
码以致用1 小时前
StarRocks的向量数据库能力
数据库·ai
2501_945423546 小时前
Django全栈开发入门:构建一个博客系统
jvm·数据库·python
gameboy0318 小时前
从MySQL迁移到PostgreSQL的完整指南
数据库·mysql·postgresql
laozhao4328 小时前
科大讯飞中标教育管理应用升级开发项目
大数据·人工智能
xdl25998 小时前
Spring Boot中集成MyBatis操作数据库详细教程
数据库·spring boot·mybatis
回到原点的码农8 小时前
Spring Data JDBC 详解
java·数据库·spring
zb200641208 小时前
Spring Boot 实战:轻松实现文件上传与下载功能
java·数据库·spring boot