HBase 复制、备份、迁移

一、行业分享

分享1 阿里云 BDS-HBase

《HBase高效一键迁移的设计与实践.pdf》
https://developer.aliyun.com/live/730
https://developer.aliyun.com/article/704972
https://developer.aliyun.com/article/704977
https://blog.csdn.net/u013411339/article/details/101185699

分享2 腾讯FIT



HBase金融大数据乾坤大挪移
https://www.jianshu.com/p/cb4a645dd66a

HBase跨机房迁移技术分享总结
https://www.jianshu.com/p/defc787b2704

dbaplus181期:腾讯金融HBase跨机房迁移实战
https://m.qlchat.com/topic/details?topicId=2000003847589595
https://dbaplus.cn/activity-12-755-1.html

二、HBase 集群间数据迁移


https://blog.csdn.net/qq1010885678/article/details/51971154

https://github.com/ucarGroup/DataLink/wiki/2.2_HBase-Reader

使用HBase快照实现跨集群全量与增量数据迁移
https://cloud.tencent.com/developer/article/1078173
https://cloud.tencent.com/developer/article/1078240

https://www.cnblogs.com/ballwql/p/hbase_data_transfer.html
https://blog.51cto.com/u_16099287/7532521
https://bbs.huaweicloud.com/blogs/163290

https://blog.csdn.net/qq_26442553/article/details/134282334
https://blog.csdn.net/wypblog/article/details/108030883
https://www.slideshare.net/jmhsieh/apache-hbase-for-the-enterprise-stratahadoop-world-2012

shell 复制代码
使用distcp方式迁移数据:
步骤1、使用distcp方式拷贝HDFS上的数据:
格式:
hadoop distcp ${旧集群HBase表在HDFS上路径} ${新集群HBase表在HDFS上路径}
例如:
hadoop distcp hdfs://192.168.75.156:8020/hbase/data/default/SYSTEM.STATS hdfs://192.168.75.11:8020/hbase/data/default/SYSTEM.STATS

步骤2、然后执行:
hbase hbck -fixMeta
hbase hbck -fixAssignments

即可把数据做HBase集群间迁移。

Snapshot

http://hbasefly.com/2017/09/17/hbase-snapshot/
https://hbase.apache.org/book.html#ops.snapshots

Replication

https://www.slideshare.net/cloudera/internals-session-7b

其他记录

http://blog.cloudera.com/blog/2012/06/online-hbase-backups-with-copytable-2
https://blog.cloudera.com/introduction-to-apache-hbase-snapshots/
http://blog.cloudera.com/blog/2013/06/introduction-to-apache-hbase-snapshots-part-2-deeper-dive/
https://hbase.apache.org/book.html#casestudies

相关推荐
lifallen7 分钟前
Paimon 原子提交实现
java·大数据·数据结构·数据库·后端·算法
TDengine (老段)36 分钟前
TDengine 数据库建模最佳实践
大数据·数据库·物联网·时序数据库·tdengine·涛思数据
张先shen43 分钟前
Elasticsearch RESTful API入门:全文搜索实战(Java版)
java·大数据·elasticsearch·搜索引擎·全文检索·restful
Elastic 中国社区官方博客1 小时前
Elasticsearch 字符串包含子字符串:高级查询技巧
大数据·数据库·elasticsearch·搜索引擎·全文检索·lucene
Gauss松鼠会1 小时前
GaussDB应用场景全景解析:从金融核心到物联网的分布式数据库实践
数据库·分布式·物联网·金融·database·gaussdb
守城小轩2 小时前
Chromium 136 编译指南 - Android 篇:开发工具安装(三)
android·数据库·redis
张先shen2 小时前
Elasticsearch RESTful API入门:全文搜索实战
java·大数据·elasticsearch·搜索引擎·全文检索·restful
尽兴-2 小时前
如何将多个.sql文件合并成一个:Windows和Linux/Mac详细指南
linux·数据库·windows·sql·macos
天翼云开发者社区2 小时前
Doris-HDFS LOAD常见问题汇总(二)
大数据·doris
小小不董2 小时前
深入理解oracle ADG和RAC
linux·服务器·数据库·oracle·dba