HBase 复制、备份、迁移

一、行业分享

分享1 阿里云 BDS-HBase

《HBase高效一键迁移的设计与实践.pdf》
https://developer.aliyun.com/live/730
https://developer.aliyun.com/article/704972
https://developer.aliyun.com/article/704977
https://blog.csdn.net/u013411339/article/details/101185699

分享2 腾讯FIT



HBase金融大数据乾坤大挪移
https://www.jianshu.com/p/cb4a645dd66a

HBase跨机房迁移技术分享总结
https://www.jianshu.com/p/defc787b2704

dbaplus181期:腾讯金融HBase跨机房迁移实战
https://m.qlchat.com/topic/details?topicId=2000003847589595
https://dbaplus.cn/activity-12-755-1.html

二、HBase 集群间数据迁移


https://blog.csdn.net/qq1010885678/article/details/51971154

https://github.com/ucarGroup/DataLink/wiki/2.2_HBase-Reader

使用HBase快照实现跨集群全量与增量数据迁移
https://cloud.tencent.com/developer/article/1078173
https://cloud.tencent.com/developer/article/1078240

https://www.cnblogs.com/ballwql/p/hbase_data_transfer.html
https://blog.51cto.com/u_16099287/7532521
https://bbs.huaweicloud.com/blogs/163290

https://blog.csdn.net/qq_26442553/article/details/134282334
https://blog.csdn.net/wypblog/article/details/108030883
https://www.slideshare.net/jmhsieh/apache-hbase-for-the-enterprise-stratahadoop-world-2012

shell 复制代码
使用distcp方式迁移数据:
步骤1、使用distcp方式拷贝HDFS上的数据:
格式:
hadoop distcp ${旧集群HBase表在HDFS上路径} ${新集群HBase表在HDFS上路径}
例如:
hadoop distcp hdfs://192.168.75.156:8020/hbase/data/default/SYSTEM.STATS hdfs://192.168.75.11:8020/hbase/data/default/SYSTEM.STATS

步骤2、然后执行:
hbase hbck -fixMeta
hbase hbck -fixAssignments

即可把数据做HBase集群间迁移。

Snapshot

http://hbasefly.com/2017/09/17/hbase-snapshot/
https://hbase.apache.org/book.html#ops.snapshots

Replication

https://www.slideshare.net/cloudera/internals-session-7b

其他记录

http://blog.cloudera.com/blog/2012/06/online-hbase-backups-with-copytable-2
https://blog.cloudera.com/introduction-to-apache-hbase-snapshots/
http://blog.cloudera.com/blog/2013/06/introduction-to-apache-hbase-snapshots-part-2-deeper-dive/
https://hbase.apache.org/book.html#casestudies

相关推荐
SelectDB1 小时前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据·数据库·aigc
这个DBA有点耶2 小时前
GROUP BY优化全解:如何写出既不丢数据又飞快的分组查询
数据库·mysql·架构
掉头发的王富贵5 小时前
【StarRocks】极限十分钟入门StarRocks
数据库·sql·mysql
Nturmoils5 小时前
WHERE 条件别凭习惯写,常用查询先跑一遍
数据库
Databend1 天前
在 AWS 中国峰会逛了一天,我在 Databend 展台看到了 Agent 数据基础设施的新思路
数据库·人工智能·agent
ClouGence2 天前
Oracle 数据同步为什么会出现数据不一致?长事务是常被忽略的原因
数据库·后端·oracle
飞将2 天前
从零实现数据库(2)——HashIndex + IndexManager
数据库
Nturmoils3 天前
订单列表慢查询,先看 WHERE、ORDER BY 和 LIMIT
数据库
渣波3 天前
拒绝 SQL 焦虑!手把手带你用 NestJS + Prisma + DTO 写出“防弹”级后端代码
javascript·数据库·后端
大大大大晴天3 天前
Hudi技术内幕:RecordPayload到RecordMerger
大数据