HBase集群环境搭建与测试

🥇🥇【大数据学习记录篇】-持续更新中~🥇🥇


个人主页:beixi@

本文章收录于专栏(点击传送):【大数据学习】
💓💓持续更新中,感谢各位前辈朋友们支持学习~💓💓

文章目录

1.HBase集群环境介绍

HBase集群由多个RegionServer节点和一个或多个HMaster节点组成。HMaster节点负责管理元数据(例如表的位置、分区等),并协调集群中的各个节点。RegionServer节点负责存储和处理数据,并与HMaster节点通信以获取元数据信息。
HBase集群的主要特点包括:

  • 可靠性:HBase采用数据副本和RegionServer读写分离等机制来实现容错和恢复能力,即使部分节点出现故障,集群仍然可用。
  • 高性能:HBase通过将表分割成不同的Region来进行水平扩展,可以处理海量数据并具有很高的读写性能。
  • 数据模型:HBase提供类似于Google的Bigtable的列族存储模型,可以灵活定义列族和列,支持动态添加或删除列族和列。
  • 多版本控制:HBase支持存储多个版本的数据,可以回滚到先前的状态,也可以查询以前的历史值。

2.搭建环境准备

本次用到的环境有:
Oracle Linux 7.4
Zookeeper3.4.6集群环境
Hadoop2.7.4集群环境

注:HBase依赖于ZooKeeper来进行分布式协调和管理,因此在搭建启用HBASE之前,需要提前搭建并启动好zookeeper集群环境,zookeeper的搭建和启动可以参考我的上一篇文章:ZooKeeper集群环境搭建

3.搭建步骤

1.启动zookeeper集群环境,zookeeper的搭建和启动可以参考我的上一篇文章:ZooKeeper集群环境搭建

2.解压HBase压缩文件至/opt目录。

bash 复制代码
tar -zxvf /root/experiment/file/hbase-1.2.6-bin.tar.gz -C /opt

3.修改解压后文件夹的名字为hbase。

bash 复制代码
cd /opt
mv /opt/hbase-1.2.6 /opt/hbase

4.查找Java安装路径

bash 复制代码
echo $JAVA_HOME

5.配置hbase-env.sh文件

bash 复制代码
vim /opt/hbase/conf/hbase-env.sh

6.按键:set nu回车设置行号,部分截图如下

7.按键27gg,光标定位到27行,部分截图如下

8.按键 i ,更改代码如下:

bash 复制代码
export JAVA_HOME=/usr/lib/java-1.8

9.按键Esc,按键128gg,光标定位到128行,部分截图如下

10.按键 i ,设置HBase使用外部独立Zookeeper集群,更改代码如下:

bash 复制代码
export HBASE_MANAGES_ZK=false

11.按键Esc,按键":wq!"保存退出。
12.配置hbase-site.xml文件

bash 复制代码
vim /opt/hbase/conf/hbase-site.xml

13.按键:set nu回车设置行号,部分截图如下

14.按键24gg,光标定位到24行,部分截图如下

15.按键 i ,在标签之间填加代码如下:

bash 复制代码
<property>
	<name>hbase.zookeeper.quorum</name>
	<value>master,slave1,slave2</value>
</property>
<property>
	<name>hbase.zookeeper.property.dataDir</name>
	<value>/root/hbase</value>
</property>
<property>
	<name>dfs.datanode.max.transfer.threads</name>
	<value>4096</value>
</property>
<property>
	<name>hbase.rootdir</name>
	<value>hdfs://master:8020/hbase</value>
</property>
<property>
	<name>hbase.cluster.distributed</name>
	<value>true</value>
</property>

16.按键Esc,按键":wq!"保存退出。
17.配置regionservers文件

bash 复制代码
vim /opt/hbase/conf/regionservers

18.按键dd,删除第一行"localhost",截图如下

19.按键 i ,填加代码如下:

bash 复制代码
slave1
slave2

按键Esc,按键":wq!"保存退出。
20.配置hbase环境变量

bash 复制代码
vim ~/.bashrc

21.按键"shift+g"组合键,达到页面底部。
22.按键 i ,填加代码如下:

bash 复制代码
export HBASE_HOME=/opt/hbase
export PATH=$PATH:$HBASE_HOME/bin

23.按键Esc,按键":wq!"保存退出。
24.刷新配置文件,使新加Hbase环境变量生效。

bash 复制代码
source ~/.bashrc

25.拷贝master主机".bashrc"文件到slave1、slave2从机"~"下。

bash 复制代码
scp ~/.bashrc slave1:~/
bash 复制代码
scp ~/.bashrc slave2:~/

26.拷贝配置好的hbase文件夹到slave1、slave2从机"/opt"下。

bash 复制代码
scp -r /opt/hbase slave1:/opt
bash 复制代码
scp -r /opt/hbase slave2:/opt

27.切换至"从节点1"机器,双击桌面"Xfce终端"图标打开命令窗口。刷新配置文件,使新加Hbase环境变量生效,退回master主机。

bash 复制代码
ssh slave1
bash 复制代码
source ~/.bashrc
bash 复制代码
exit

28.切换至"从节点2"机器,双击桌面"Xfce终端"图标打开命令窗口。刷新配置文件,使新加Hbase环境变量生效,退回master主机。

bash 复制代码
ssh slave2
bash 复制代码
source ~/.bashrc
bash 复制代码
exit

4.HBase集群环境启动、验证和停止

1.切换至"主节点",双击桌面"Xfce终端"图标打开命令窗口,启动Hadoop。

bash 复制代码
start-all.sh

2.启动HBase。

bash 复制代码
start-hbase.sh

3.查看守护进程。其中HMaster为HBase的守护进程。

bash 复制代码
jps

4.切换至"从节点1",查看守护进程。其中HRegionServer为HBase的守护进程。

bash 复制代码
ssh slave1
bash 复制代码
jps
bash 复制代码
exit

5.切换至"从节点2",查看守护进程。其中HRegionServer为HBase的守护进程。

bash 复制代码
ssh slave2
bash 复制代码
jps
bash 复制代码
exit

6.切换至"主节点",查看HDFS平台上Hbase。

bash 复制代码
hdfs dfs -lsr /hbase

7.启动HBase-shell。

bash 复制代码
hbase shell

8.HBase下建立带有一个列族family1的表table1。

bash 复制代码
create 'table1','family1'

9.向表table1中列族family1下建立列为column1,并向列中播入数据value-1。

bash 复制代码
put 'table1','myrow-1','family1:column1','value-1'

10.查询表table1中内容。

bash 复制代码
scan 'table1'

11.删除表。

bash 复制代码
disable 'table1'
bash 复制代码
drop 'table1'

12.退出HBase shell。

bash 复制代码
quit

13.停止Hbase进程。注意:这里速度有点慢,可能需要稍等几分钟。

bash 复制代码
stop-hbase.sh

14.停止Hadoop进程。

bash 复制代码
stop-all.sh

15.停止"主节点",即master机上的zookeeper进程。

bash 复制代码
zkServer.sh stop

16.停止"从节点1",即slave1机上的zookeeper进程。

bash 复制代码
ssh slave1
bash 复制代码
zkServer.sh stop
bash 复制代码
exit

17.停止"从节点2",即slave2机上的zookeeper进程。

bash 复制代码
ssh slave2
bash 复制代码
zkServer.sh stop
相关推荐
time never ceases13 分钟前
使用docker方式进行Oracle数据库的物理迁移(helowin/oracle_11g)
数据库·docker·oracle
Jason-河山15 分钟前
【自动化更新,让商品信息跳舞】——利用API返回值的幽默编程之旅
运维·自动化
Frank牛蛙17 分钟前
1.每日SQL----2024/11/7
数据库·sql
饮浊酒18 分钟前
Linux操作系统 ------(3.文本编译器Vim)
linux·vim
Ciderw19 分钟前
块存储、文件存储和对象存储详细介绍
网络·数据库·nvme·对象存储·存储·块存储·文件存储
薛晓刚19 分钟前
数据库优化指南:如何将基本功能运用到极致?
数据库
stars_User23 分钟前
MySQL数据库面试题(下)
数据库·mysql
lihuhelihu27 分钟前
第3章 CentOS系统管理
linux·运维·服务器·计算机网络·ubuntu·centos·云计算
哲讯智能科技29 分钟前
SAP Business One市场价格解析
运维·sap·erp
WX187021128731 小时前
在分布式光伏电站如何进行电能质量的治理?
分布式