HBase snapshot+replication 测试

一、背景

画像标签服务(CDP)是核心服务,被公司其他系统如现金、电商、风控等核心业务调用。异常的话,影响范围大。

二、目标

存量数据测试通过 snapshot 迁移。增量数据测试通过 replication 同步。

三、测试

方案二测试,两个独立HBase集群,snapshot+replication

(1)存量数据迁移 (snapshot)

1、同步数据到目标hbase集群

shell 复制代码
hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot \
-snapshot test_20240315_1 \
-copy-from hdfs://10.9.21.38:8020/hbase \
-copy-to hdfs://10.9.21.38:8020/hbase_new \
-mappers 1 \
-bandwidth 128


以上命令产生的 Yarn 任务:

2、在目标hbase集群上查询数据

shell 复制代码
restore_snapshot 'test_20240315_1'
scan 'test'

(2)增量数据同步 (replication)

1、原集群上执行。增加从集群。

shell 复制代码
add_peer '1', CLUSTER_KEY => "10.9.109.203:2181:/hbase_new"
list_peers

2、原集群上执行。修改表属性,设置复制目标从集群。

shell 复制代码
alter 't2024',{NAME => 'cf1' , REPLICATION_SCOPE=>'1'}

3、原集群上执行。写入数据。

4、从集群上执行。从集群确认数据同步成功。

相关推荐
竹君子6 分钟前
新能源知识库(167)什么是章鱼能源?
大数据·人工智能·能源
Psycho_MrZhang8 分钟前
MySQL/PgSQL设计思想总结
数据库·mysql
风吹落叶花飘荡10 分钟前
将mysql数据库的内容备份至阿里云 oss归档存储
数据库·mysql·阿里云
数据大魔方37 分钟前
【期货量化入门】期权交易入门:从零开始学期权量化(TqSdk完整教程)
数据库·python·mysql·算法·区块链·程序员创富
虫小宝1 小时前
导购APP高可用数据库设计:主从分离与分库分表在返利系统中的应用
android·数据库
期货资管源码1 小时前
外盘期货资管分仓软件源码搭建教程
大数据·源代码管理
Justice Young1 小时前
Hive第四章:HIVE Operators and Functions
大数据·数据仓库·hive·hadoop
fie88891 小时前
基于蚁群算法求解带时间窗的车辆路径问题
数据库·人工智能·算法
memgLIFE1 小时前
mybatis数据库查询
数据库·oracle·mybatis
闲人不梦卿1 小时前
数据库系统概念
数据库