分布式数据恢复-hbase+hive分布式存储误删除如何恢复数据?

hbase+hive分布式存储数据恢复环境:

16台某品牌R730XD服务器节点,每台物理服务器节点上有数台虚拟机,虚拟机上配置的分布式,上层部署hbase数据库+hive数据仓库。

hbase+hive分布式存储故障&初检:

数据库文件被误删除,数据库无法使用。

通过现场对该分布式环境的初步检测,发现虚拟机还可以正常启动,虚拟机里面的数据库块文件丢失。好在块文件丢失之后没有对集群环境写入数据,底层数据损坏可能性比较小。

hbase+hive分布式存储数据恢复方案:

1、备份。

A、从物理服务器底层做备份,将设备断电、关机。将所有磁盘编号后从服务器/存储中取出。

B、从虚拟机层面备份,通过网络直接备份虚拟机底层磁盘文件。

C、北亚企安数据恢复中心准备一台服务器以只读方式挂载服务器硬盘,对所有磁盘进行扇区对扇区的全盘镜像备份。

D、备份完成后提供详细报告,内容涉及所有磁盘的健康状态和存在的坏道列表。

E、将服务器硬盘按照编号还原到原服务器/存储设备中,之后数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。

2、基于镜像文件分析块文件结构。

A、分析每个虚拟机磁盘的块文件。

B、分析文件底层的聚合方式。

C、分析磁盘中数据分布情况。

3、分析Block文件key。

A、定位数据库文件中的key信息。

B、提取并解析数据库文件中key信息。

C、整合数据库文件key信息。

4、拼接Block文件。

A、根据Block文件的key信息提取文件片段。

B、拼接Block文件的片段。

C、校验拼接后的Block文件的正确性。

5、导入Block文件。

A、校验提取出来的Block文件完整性和正确性。

B、把提取出来的Block文件导入到hbase和hive数据仓库中。

6、验证数据。

由用户对数据进行详细验证。如果发现问题则重新检验上面的恢复流程。

相关推荐
北亚数据恢复15 小时前
服务器数据恢复—外接扩展柜存储设备上RAID5阵列故障数据恢复实例
数据恢复·服务器数据恢复·北亚数据恢复·存储数据恢复·raid数据恢复
大帅点兵16 小时前
设计一个金融交易监控系统
大数据·clickhouse·flink·spark·kafka·hbase
abcy07121317 小时前
HBase Region数据恢复详解
hbase
abcy07121318 小时前
RegionServer 自动重启原因详解
hbase
小欣加油2 天前
Hive综合应用案例——用户学历查询
数据仓库·hive·hadoop
yumgpkpm2 天前
Hadoop(CDH6、CDP7)在Qwen3.7大模型训练中的作用,(含部署、运行操作步骤)
大数据·hive·hadoop·分布式·zookeeper·spark·kafka
北亚数据恢复2 天前
服务器数据恢复—Linux系统EXT3分区RAID5阵列故障恢复复盘
数据恢复·服务器数据恢复·北亚数据恢复·存储数据恢复·raid数据恢复
juniperhan4 天前
Flink 系列第25篇:Flink SQL 集成 Hive 实践:流批一体下的实时数仓利器
大数据·数据仓库·hive·分布式·sql·flink
r-t-H5 天前
从零开始搭建CDH-第十二章
linux·hive·spark·centos·hbase
王小王-1235 天前
基于Hadoop的服装电商数据分析系统【Hdfs、flume、HIve、sqoop、MySQL、echarts】
hive·hadoop·hdfs·服装电商分析·服装大数据