HBase 复制、备份、迁移

一、行业分享

分享1 阿里云 BDS-HBase

《HBase高效一键迁移的设计与实践.pdf》
https://developer.aliyun.com/live/730
https://developer.aliyun.com/article/704972
https://developer.aliyun.com/article/704977
https://blog.csdn.net/u013411339/article/details/101185699

分享2 腾讯FIT



HBase金融大数据乾坤大挪移
https://www.jianshu.com/p/cb4a645dd66a

HBase跨机房迁移技术分享总结
https://www.jianshu.com/p/defc787b2704

dbaplus181期:腾讯金融HBase跨机房迁移实战
https://m.qlchat.com/topic/details?topicId=2000003847589595
https://dbaplus.cn/activity-12-755-1.html

二、HBase 集群间数据迁移


https://blog.csdn.net/qq1010885678/article/details/51971154

https://github.com/ucarGroup/DataLink/wiki/2.2_HBase-Reader

使用HBase快照实现跨集群全量与增量数据迁移
https://cloud.tencent.com/developer/article/1078173
https://cloud.tencent.com/developer/article/1078240

https://www.cnblogs.com/ballwql/p/hbase_data_transfer.html
https://blog.51cto.com/u_16099287/7532521
https://bbs.huaweicloud.com/blogs/163290

https://blog.csdn.net/qq_26442553/article/details/134282334
https://blog.csdn.net/wypblog/article/details/108030883
https://www.slideshare.net/jmhsieh/apache-hbase-for-the-enterprise-stratahadoop-world-2012

shell 复制代码
使用distcp方式迁移数据:
步骤1、使用distcp方式拷贝HDFS上的数据:
格式:
hadoop distcp ${旧集群HBase表在HDFS上路径} ${新集群HBase表在HDFS上路径}
例如:
hadoop distcp hdfs://192.168.75.156:8020/hbase/data/default/SYSTEM.STATS hdfs://192.168.75.11:8020/hbase/data/default/SYSTEM.STATS

步骤2、然后执行:
hbase hbck -fixMeta
hbase hbck -fixAssignments

即可把数据做HBase集群间迁移。

Snapshot

http://hbasefly.com/2017/09/17/hbase-snapshot/
https://hbase.apache.org/book.html#ops.snapshots

Replication

https://www.slideshare.net/cloudera/internals-session-7b

其他记录

http://blog.cloudera.com/blog/2012/06/online-hbase-backups-with-copytable-2
https://blog.cloudera.com/introduction-to-apache-hbase-snapshots/
http://blog.cloudera.com/blog/2013/06/introduction-to-apache-hbase-snapshots-part-2-deeper-dive/
https://hbase.apache.org/book.html#casestudies

相关推荐
倔强的石头_9 小时前
kingbase备份与恢复实战(二)—— sys_dump库级逻辑备份与恢复(Windows详细步骤)
数据库
武子康14 小时前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天16 小时前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
jiayou642 天前
KingbaseES 实战:深度解析数据库对象访问权限管理
数据库
李广坤2 天前
MySQL 大表字段变更实践(改名 + 改类型 + 改长度)
数据库
武子康3 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
爱可生开源社区3 天前
2026 年,优秀的 DBA 需要具备哪些素质?
数据库·人工智能·dba
随逸1774 天前
《从零搭建NestJS项目》
数据库·typescript
武子康4 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP4 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet