HBase snapshot+replication 测试

一、背景

画像标签服务(CDP)是核心服务,被公司其他系统如现金、电商、风控等核心业务调用。异常的话,影响范围大。

二、目标

存量数据测试通过 snapshot 迁移。增量数据测试通过 replication 同步。

三、测试

方案二测试,两个独立HBase集群,snapshot+replication

(1)存量数据迁移 (snapshot)

1、同步数据到目标hbase集群

shell 复制代码
hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot \
-snapshot test_20240315_1 \
-copy-from hdfs://10.9.21.38:8020/hbase \
-copy-to hdfs://10.9.21.38:8020/hbase_new \
-mappers 1 \
-bandwidth 128


以上命令产生的 Yarn 任务:

2、在目标hbase集群上查询数据

shell 复制代码
restore_snapshot 'test_20240315_1'
scan 'test'

(2)增量数据同步 (replication)

1、原集群上执行。增加从集群。

shell 复制代码
add_peer '1', CLUSTER_KEY => "10.9.109.203:2181:/hbase_new"
list_peers

2、原集群上执行。修改表属性,设置复制目标从集群。

shell 复制代码
alter 't2024',{NAME => 'cf1' , REPLICATION_SCOPE=>'1'}

3、原集群上执行。写入数据。

4、从集群上执行。从集群确认数据同步成功。

相关推荐
SelectDB11 分钟前
驾驭 CPU 与编译器:Apache Doris 实现极致性能的底层逻辑
运维·数据库·apache
zbguolei21 分钟前
MySQL根据身份证号码计算出生日期和年龄
数据库·mysql
马克学长1 小时前
SSM校园图书借阅服务系统jd2z8(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面
数据库·图书管理系统·ssm 框架·ssm 校园图书借阅系统
软件派1 小时前
高斯数据库使用心得——从性能优化到行业实践的深度解析
数据库·oracle
qq_262496092 小时前
Elasticsearch 核心参数调优指南
大数据·elasticsearch
Chan162 小时前
场景题:CPU 100% 问题怎么排查?
java·数据库·redis·后端·spring
OpenCSG2 小时前
AgenticOps 如何重构企业 AI 的全生命周期管理体系
大数据·人工智能·深度学习
阿里云大数据AI技术2 小时前
漫画说:为什么你的“增量计算”越跑越慢?——90%的实时数仓团队都踩过的坑,藏在这几格漫画里
大数据·人工智能
电商API_180079052473 小时前
批量获取电商商品数据的主流技术方法全解析
大数据·数据库·人工智能·数据分析·网络爬虫
rgeshfgreh3 小时前
Python流程控制:从条件到循环实战
前端·数据库·python