HBase snapshot+replication 测试

一、背景

画像标签服务(CDP)是核心服务,被公司其他系统如现金、电商、风控等核心业务调用。异常的话,影响范围大。

二、目标

存量数据测试通过 snapshot 迁移。增量数据测试通过 replication 同步。

三、测试

方案二测试,两个独立HBase集群,snapshot+replication

(1)存量数据迁移 (snapshot)

1、同步数据到目标hbase集群

shell 复制代码
hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot \
-snapshot test_20240315_1 \
-copy-from hdfs://10.9.21.38:8020/hbase \
-copy-to hdfs://10.9.21.38:8020/hbase_new \
-mappers 1 \
-bandwidth 128


以上命令产生的 Yarn 任务:

2、在目标hbase集群上查询数据

shell 复制代码
restore_snapshot 'test_20240315_1'
scan 'test'

(2)增量数据同步 (replication)

1、原集群上执行。增加从集群。

shell 复制代码
add_peer '1', CLUSTER_KEY => "10.9.109.203:2181:/hbase_new"
list_peers

2、原集群上执行。修改表属性,设置复制目标从集群。

shell 复制代码
alter 't2024',{NAME => 'cf1' , REPLICATION_SCOPE=>'1'}

3、原集群上执行。写入数据。

4、从集群上执行。从集群确认数据同步成功。

相关推荐
华阙之梦3 分钟前
【仅公网互通的 Spark 集群通信与配置实战方案】
大数据·ajax·spark
Evan芙3 分钟前
基于Nginx和Python的动态站点安装配置
数据库·python·nginx
PS1232324 分钟前
桥梁与隧道安全守护者 抗冰冻型风速监测方案
大数据·人工智能
CES_Asia9 分钟前
资本赋能实体智能——2026 CES Asia机器人产业投资峰会定档北京
大数据·人工智能·microsoft·机器人
程序员大辉13 分钟前
免费的mysql链接工具HeidiSQL比Navicat好用
数据库·mysql
延凡科技13 分钟前
延凡 APM 应用性能管理系统:AI+eBPF 驱动全栈智能可观测
大数据·人工智能·科技·能源
新诺韦尔API18 分钟前
手机空号检测接口和手机号状态查询接口有什么区别?
大数据·智能手机·api
易连EDI—EasyLink20 分钟前
EDI数据交换2026年展望:洞察2026年EDI数据交换的新范式
大数据·人工智能·edi·电子数据交换·as2
cui_win31 分钟前
Redis 生产环境命令管控规范
数据库·redis·缓存
woshilys34 分钟前
oracle 和sql server 查询数据时锁的区别
数据库·oracle