安装 hbase(伪分布式)

目录

[1、安装 jdk8](#1、安装 jdk8)

[(1)选择 jdk 版本](#(1)选择 jdk 版本)

[(2)下载 jdk 并解压](#(2)下载 jdk 并解压)

(3)配置环境变量

2、安装hadoop

[(1)添加 hadoop 用户,配置免密登录](#(1)添加 hadoop 用户,配置免密登录)

[(2)下载 hadoop-3.4.0.tar.gz](#(2)下载 hadoop-3.4.0.tar.gz)

(3)配置环境变量

(4)修改配置文件

[(5)修改文件权限,并且换到 hadoop 用户](#(5)修改文件权限,并且换到 hadoop 用户)

[(7)验证Hadoop DFS](#(7)验证Hadoop DFS)

[(8)启动 dfs](#(8)启动 dfs)

(9)验证yarn脚本

(10)浏览器访问

[(11)启动 hdfs 告警:WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform](#(11)启动 hdfs 告警:WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform)

[3、安装 hbase](#3、安装 hbase)

[(1)下载 hbase-2.5.8-hadoop3-bin.tar.gz](#(1)下载 hbase-2.5.8-hadoop3-bin.tar.gz)

(2)配置环境变量

(3)修改配置文件

[(4)添加 zookeeper 目录](#(4)添加 zookeeper 目录)

[(5)修改文件权限,并且换到 hadoop 用户](#(5)修改文件权限,并且换到 hadoop 用户)

[(6)启动 hbase](#(6)启动 hbase)

(7)浏览器访问

[(8)命令行验证 hbase shell](#(8)命令行验证 hbase shell)

[(9)关闭 hbase](#(9)关闭 hbase)

[(10)hbase shell 报错:ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet。](#(10)hbase shell 报错:ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet。)

[4、gohbase 客户端外部连接测试](#4、gohbase 客户端外部连接测试)

[(1)首先使用 hbase shell 创建一个 emp 表,含有一个列组 a。](#(1)首先使用 hbase shell 创建一个 emp 表,含有一个列组 a。)

[(2)然后利用 gohbase 客户端向 hbase 插入一条测试数据](#(2)然后利用 gohbase 客户端向 hbase 插入一条测试数据)

[(3)连接报错:failed to dial RegionServer: dial tcp [::1]:16020: connectex: No connection could be made because the target machine actively refused it.](#(3)连接报错:failed to dial RegionServer: dial tcp [::1]:16020: connectex: No connection could be made because the target machine actively refused it.)


1、安装 jdk8

(1)选择 jdk 版本

jdk版本选择:https://hbase.apache.org/book.html#java

jdk华为源下载:https://repo.huaweicloud.com/java/jdk/8u172-b11/

(2)下载 jdk 并解压
bash 复制代码
cd /usr/local
wget https://repo.huaweicloud.com/java/jdk/8u172-b11/jdk-8u172-linux-x64.tar.gz
tar zxf jdk-8u172-linux-x64.tar.gz
(3)配置环境变量
bash 复制代码
# vim /etc/profile

export JAVA_HOME=/usr/local/jdk1.8.0_172
export PATH=$PATH:$JAVA_HOME/bin:$JAVA_HOME/jre/bin
export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib

# source /etc/profile

#参考

https://blog.csdn.net/codedz/article/details/124044974

https://www.cnblogs.com/aerfazhe/p/15545946.html

https://www.cnblogs.com/aerfazhe/p/15545946.html

2、安装hadoop

(1)添加 hadoop 用户,配置免密登录
bash 复制代码
useradd hadoop
#passwd hadoop

ssh-keygen -t rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 0600 ~/.ssh/authorized_keys
(2)下载 hadoop-3.4.0.tar.gz
bash 复制代码
cd /usr/local
wget https://dlcdn.apache.org/hadoop/core/stable/hadoop-3.4.0.tar.gz
tar zxf hadoop-3.4.0.tar.gz
(3)配置环境变量
bash 复制代码
# vim /etc/profile

export HADOOP_HOME=/usr/local/hadoop-3.4.0
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin
export HADOOP_INSTALL=$HADOOP_HOME

# source /etc/profile
(4)修改配置文件
bash 复制代码
cd /usr/local/hadoop-3.4.0/etc/hadoop/

vim hadoop-env.sh
export JAVA_HOME=/usr/local/jdk1.8.0_71

vim core-site.xml
<configuration>
    <property>
        <name>fs.default.name</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

vim hdfs-site.xml
<configuration>
   <property>
      <name>dfs.replication</name>
      <value>1</value>
   </property>
   <property>
      <name>dfs.name.dir</name>
      <value>file:///home/hadoop/hadoopinfra/hdfs/namenode </value>
   </property>
   <property>
      <name>dfs.data.dir</name>
      <value>file:///home/hadoop/hadoopinfra/hdfs/datanode </value>
   </property>
</configuration>

vim yarn-site.xml
<configuration>
   <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value>
   </property>
</configuration>

vim mapred-site.xml
<configuration>
   <property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
   </property>
</configuration>
(5)修改文件权限,并且换到 hadoop 用户
bash 复制代码
chown -R hadoop:hadoop hadoop-3.4.0  
su hadoop
(7)验证Hadoop DFS
bash 复制代码
hdfs namenode -format
(8)启动 dfs
cpp 复制代码
./sbin/start-dfs.sh

# 查看进程
jps

71168 SecondaryNameNode

71681 NameNode

71834 DataNode

72289 ResourceManager

72396 NodeManager

(9)验证yarn脚本
bash 复制代码
./sbin/start-yarn.sh
(10)浏览器访问
bash 复制代码
http://localhost:9870
http://localhost:8088
(11)启动 hdfs 告警:WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform

不改也不影响,添加如下环境变量即可

bash 复制代码
# vim /etc/profile
export JAVA_LIBRARY_PATH=/usr/local/hbase-2.5.8-hadoop3/lib/native
# source /etc/profile

参考

https://blog.csdn.net/weixin_45678985/article/details/120497297

3、安装 hbase

(1)下载 hbase-2.5.8-hadoop3-bin.tar.gz
bash 复制代码
cd /usr/local
wget https://dlcdn.apache.org/hbase/2.5.8/hbase-2.5.8-hadoop3-bin.tar.gz
tar zxf hbase-2.5.8-hadoop3-bin.tar.gz
(2)配置环境变量
bash 复制代码
export HBASE_HOME=/usr/local/hbase-2.5.8-hadoop3
export PATH=$PATH:$HBASE_HOME/bin
(3)修改配置文件
bash 复制代码
cd /usr/local/hbase-2.5.8-hadoop3/conf

vim hbase-env.sh
export JAVA_HOME=/usr/local/jdk1.8.0_172

vim hbase-site.xml
<property>
   <name>hbase.cluster.distributed</name>
   <value>true</value>
</property>
<property>
   <name>hbase.rootdir</name>
   <value>hdfs://localhost:9000/hbase</value>
</property>
<property>
    <name>hbase.zookeeper.property.dataDir</name>
    <value>/home/zookeeper</value>
</property>
(4)添加 zookeeper 目录
bash 复制代码
mkdir -p /home/zookeeper
chown -R hadoop:hadoop /home/zookeeper
(5)修改文件权限,并且换到 hadoop 用户
bash 复制代码
chown -R hadoop:hadoop hbase-2.5.8-hadoop3
su hadoop
(6)启动 hbase
bash 复制代码
./bin/start-hbase.sh

# 查看进程
jps

71168 SecondaryNameNode

71681 NameNode

71834 DataNode

72289 ResourceManager

72396 NodeManager

74089 HQuorumPeer

74186 HMaster

74271 HRegionServer

(7)浏览器访问
bash 复制代码
http://localhost:16010
(8)命令行验证 hbase shell
bash 复制代码
./bin/hbase shell
> list
(9)关闭 hbase
bash 复制代码
./bin/stop-hbase.sh
# kill -9 ${HRegionServer-PID} ${HMaster-PID} ${HQuorumPeer-PID}
(10)hbase shell 报错:ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet。

关闭 hbase,修改配置文件,然后重启

bash 复制代码
vim conf/hbase-env.sh
export HBASE_DISABLE_HADOOP_CLASSPATH_LOOKUP=true

参考

https://hadoopdoc.com/hbase/hbase-install

https://cn.linux-console.net/?p=21626

https://blog.csdn.net/qq_45811072/article/details/121693142

4、gohbase 客户端外部连接测试

(1)首先使用 hbase shell 创建一个 emp 表,含有一个列组 a。
Go 复制代码
./bin/hbase shell

# 创建表
> create 'emp', 'a'

# 查看表列表
> list

# 查看表结构
> describe 'emp'
(2)然后利用 gohbase 客户端向 hbase 插入一条测试数据

put 'emp','2','a:age','20'

向 emp 表插入一条数据,rowkey='2',column_family='a',column='age',value='20'

Go 复制代码
package main

import (
	"context"
	"github.com/tsuna/gohbase"
	"github.com/tsuna/gohbase/hrpc"
	"log"
)

func main() {
	client := gohbase.NewClient("xxx.xxx.xxx.xxx:2181")

	// Values maps a ColumnFamily -> Qualifiers -> Values.
	values := map[string]map[string][]byte{"a": map[string][]byte{"age": []byte{20}}}
	putRequest, err := hrpc.NewPutStr(context.Background(), "emp", "2", values)
	if err != nil {
		log.Fatalln("hrpc.NewPutStr error:", err)
		return
	}

	rsp, err := client.Put(putRequest)
	if err != nil {
		log.Fatalln("client.Put error:", err)
		return
	}

	rsp.String()
}
(3)连接报错:failed to dial RegionServer: dial tcp [::1]:16020: connectex: No connection could be made because the target machine actively refused it.

time="2024-06-04T10:51:31+08:00" level=info msg="added new region client" client="RegionClient{Addr: localhost:16020}"

time="2024-06-04T10:51:33+08:00" level=error msg="error occured, closing region client" client="RegionClient{Addr: localhost:16020}" err="failed to dial RegionServer: dial tcp [::1]:16020: connectex: No connection could be made because the target machine actively refused it."

time="2024-06-04T10:51:33+08:00" level=info msg="removed region client" client="RegionClient{Addr: localhost:16020}"

具体连接哪个 regionserver 是由 zk 返回的,默认返回的 regionserver 是主机名,由于没有配置主机名,返回的 regionserver 地址是一个本机地址 localhost:16020,导致外部无法连接。并且通过 netstat -nltp 查看端口监听状态可知,16020 监听在 127.0.0.1 网卡上。这两项都导致了在外部无法连接 16020 端口。

在服务器端:

  • 设置服务器主机名为 node01;
  • 查看主机对外ip,并修改 hosts 文件,将主机名绑定主机对外IP(注意不要绑定127.0.0.1,要绑定外部可以访问的ip);
  • 修改 regionservers 配置文件,以主机名代替原来的 localhost。
bash 复制代码
# 修改主机名为 node01
hostnamectl set-hostname node01

# 添加主机名到主机对外ip的映射
ip addr
vim /etc/hosts
xxx.xxx.xxx.xxx node01

# 修改 regionservers 配置文件
vim conf/regionservers
node01

在客户端,同样将 hbase 主机名绑定到 hbase 主机IP。

bash 复制代码
xxx.xxx.xxx.xxx node01

参考

https://www.cnblogs.com/shanheyongmu/p/15657255.html

https://segmentfault.com/a/1190000019857725

相关推荐
gma9991 小时前
Etcd 框架
数据库·etcd
爱吃青椒不爱吃西红柿‍️1 小时前
华为ASP与CSP是什么?
服务器·前端·数据库
Yz98762 小时前
hive的存储格式
大数据·数据库·数据仓库·hive·hadoop·数据库开发
武子康2 小时前
大数据-230 离线数仓 - ODS层的构建 Hive处理 UDF 与 SerDe 处理 与 当前总结
java·大数据·数据仓库·hive·hadoop·sql·hdfs
武子康2 小时前
大数据-231 离线数仓 - DWS 层、ADS 层的创建 Hive 执行脚本
java·大数据·数据仓库·hive·hadoop·mysql
苏-言2 小时前
Spring IOC实战指南:从零到一的构建过程
java·数据库·spring
Ljw...2 小时前
索引(MySQL)
数据库·mysql·索引
菠萝咕噜肉i2 小时前
超详细:Redis分布式锁
数据库·redis·分布式·缓存·分布式锁
长风清留扬2 小时前
一篇文章了解何为 “大数据治理“ 理论与实践
大数据·数据库·面试·数据治理
OpsEye2 小时前
MySQL 8.0.40版本自动升级异常的预警提示
数据库·mysql·数据库升级