HBase snapshot+replication 测试

一、背景

画像标签服务(CDP)是核心服务,被公司其他系统如现金、电商、风控等核心业务调用。异常的话,影响范围大。

二、目标

存量数据测试通过 snapshot 迁移。增量数据测试通过 replication 同步。

三、测试

方案二测试,两个独立HBase集群,snapshot+replication

(1)存量数据迁移 (snapshot)

1、同步数据到目标hbase集群

shell 复制代码
hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot \
-snapshot test_20240315_1 \
-copy-from hdfs://10.9.21.38:8020/hbase \
-copy-to hdfs://10.9.21.38:8020/hbase_new \
-mappers 1 \
-bandwidth 128


以上命令产生的 Yarn 任务:

2、在目标hbase集群上查询数据

shell 复制代码
restore_snapshot 'test_20240315_1'
scan 'test'

(2)增量数据同步 (replication)

1、原集群上执行。增加从集群。

shell 复制代码
add_peer '1', CLUSTER_KEY => "10.9.109.203:2181:/hbase_new"
list_peers

2、原集群上执行。修改表属性,设置复制目标从集群。

shell 复制代码
alter 't2024',{NAME => 'cf1' , REPLICATION_SCOPE=>'1'}

3、原集群上执行。写入数据。

4、从集群上执行。从集群确认数据同步成功。

相关推荐
jianqimingtian6 分钟前
如何使用 Matlab 制作 GrabCAD 体素打印切片
数据结构·数据库
真真假假々11 分钟前
MySQL和ADSDB
数据库·mysql
秦老师Q12 分钟前
MySQL第二章 sql约束与sql数据类型
数据库·sql·mysql
不是二师兄的八戒16 分钟前
mysql in查询大数据量业务无法避免情境下优化
数据库·mysql
----云烟----30 分钟前
Qt获取文件夹下的文件个数(过滤和不过滤的区别)
数据库·qt
Dotrust东信创智30 分钟前
浅谈丨功能安全测试,汽车的守护者
运维·服务器·数据库
开利网络31 分钟前
数字化转型:企业降本增效的关键之路
大数据·物联网·搜索引擎·信息可视化·1024程序员节
清水白石0082 小时前
从一个“支付状态不一致“的bug,看大型分布式系统的“隐藏杀机“
java·数据库·bug
Elastic 中国社区官方博客5 小时前
使用 Elastic AI Assistant for Search 和 Azure OpenAI 实现从 0 到 60 的转变
大数据·人工智能·elasticsearch·microsoft·搜索引擎·ai·azure
Python私教6 小时前
model中能定义字段声明不存储到数据库吗
数据库·oracle