CentOS7 服务器安装 Hadoop 和 Hive

CentOS 服务器安装 Hadoop 和 Hive流程

请将以下的路径更换为自己的路径

1. 环境准备

1.1 安装 JDK

Hadoop 和 Hive 需要 Java 运行环境,这里安装 OpenJDK 1.8:

bash 复制代码
# 查看 Java 版本
java -version

1.2 创建 Hadoop 用户(可选)

bash 复制代码
useradd hadoop
passwd hadoop

2. 安装 Hadoop

2.1 下载 Hadoop 3.3.6

bash 复制代码
wget https://dlcdn.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz

2.2 解压并移动到目标目录

bash 复制代码
tar -zxvf hadoop-3.3.6.tar.gz
mv hadoop-3.3.6 /opt/CJY/hadoop

2.3 配置环境变量

编辑 /etc/profile~/.bashrc,添加以下内容:

bash 复制代码
export HADOOP_HOME=/opt/CJY/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

然后执行:

bash 复制代码
source /etc/profile

2.4 修改 Hadoop 配置

进入 Hadoop 配置目录:

bash 复制代码
cd $HADOOP_HOME/etc/hadoop
2.4.1 修改 hadoop-env.sh
bash 复制代码
export JAVA_HOME=/usr  自己的javahome
2.4.2 配置 core-site.xml

自己的地址,localhost使用服务器的内网地址比如:10.9.6.8

xml 复制代码
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>
2.4.3 配置 hdfs-site.xml
xml 复制代码
<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

2.5 初始化 HDFS

bash 复制代码
hdfs namenode -format

2.6 启动 Hadoop

bash 复制代码
start-dfs.sh

访问 Web UI 进行验证:

  • NameNode WebUI: http://<服务器IP>:9870

3. 安装 Hive

3.1 下载 Hive 3.1.3

bash 复制代码
wget https://dlcdn.apache.org/hive/hive-3.1.3/apache-hive-3.1.3-bin.tar.gz

3.2 解压并移动到目标目录

bash 复制代码
tar -zxvf apache-hive-3.1.3-bin.tar.gz
mv apache-hive-3.1.3-bin /opt/CJY/hive

3.3 配置环境变量

编辑 /etc/profile~/.bashrc,添加以下内容:

bash 复制代码
export HIVE_HOME=/opt/CJY/hive
export PATH=$PATH:$HIVE_HOME/bin
export HADOOP_HOME=/opt/CJY/hadoop

然后执行:

bash 复制代码
source /etc/profile

3.4 配置 Hive 使用 MySQL 作为元数据库

3.4.1 创建 Hive 元数据库和用户

也可以使用navicate手动创建

bash 复制代码
mysql -u root -p

在 MySQL 中执行:

sql 复制代码
CREATE DATABASE hive_metastore DEFAULT CHARACTER SET utf8;
CREATE USER 'hiveuser'@'localhost' IDENTIFIED BY 'hivepassword';
GRANT ALL PRIVILEGES ON hive_metastore.* TO 'hiveuser'@'localhost';
FLUSH PRIVILEGES;
EXIT;
3.4.2 安装 MySQL JDBC 驱动

从 MySQL 官方网站下载 mysql-connector-java-8.0.26.jar,或者从本地maven仓库拉一个。然后执行:

bash 复制代码
cp mysql-connector-java-8.0.26.jar /opt/CJY/hive/lib/
3.4.3 创建 hive-site.xml

在/opt/CJY/hive/conf目录下创建创建 hive-site.xml

bash 复制代码
cd /opt/CJY/hive/conf
vim hive-site.xml
xml 复制代码
<configuration>
    <property>
        <name>javax.jdo.option.ConnectionURL</name>
        <value>jdbc:mysql://localhost:3306/hive_metastore?createDatabaseIfNotExist=true</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionDriverName</name>
        <value>com.mysql.cj.jdbc.Driver</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionUserName</name>
        <value>hiveuser</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionPassword</name>
        <value>hivepassword</value>
    </property>
    <property>
        <name>hive.metastore.warehouse.dir</name>
        <value>/opt/CJY/hive/warehouse</value>
    </property>
</configuration>

3.5 初始化 Hive 元数据库

bash 复制代码
/opt/CJY/hive/bin/schematool -initSchema -dbType mysql -driver com.mysql.cj.jdbc.Driver

3.6 测试 Hive

bash 复制代码
/opt/CJY/hive/bin/hive

在 Hive CLI 中执行:

sql 复制代码
SHOW DATABASES;
CREATE TABLE test_table (id INT, name STRING);
INSERT INTO test_table VALUES (1, 'Spark');
SELECT * FROM test_table;

如果返回预期结果,说明 Hive 配置成功!

相关推荐
yumgpkpm3 分钟前
腾讯云TBDS与CDH迁移常见问题有哪些?建议由CDH迁移到CMP 7.13 平台(类Cloudera CDP,如华为鲲鹏 ARM 版)
hive·hadoop·zookeeper·flink·spark·kafka·hbase
wadesir2 小时前
当前位置:首页 > 服务器技术 > 正文Linux网络HSRP协议(实现路由器热备份与高可用性的实用指南)
linux·服务器·网络
泡沫·2 小时前
4.iSCSI 服务器
运维·服务器·数据库
胡八一2 小时前
解决PHP未检测到您服务器环境的sqlite3数据库扩展报错
服务器·数据库·php
不解不惑2 小时前
OpenAI whisper 语音识别服务器搭建
服务器·whisper·语音识别
gaize12132 小时前
适合业务规模较大的场景的服务器测评
服务器
悠悠121383 小时前
告别Zabbix?我用Netdata只花10分钟就搞定了50台服务器的秒级监控(保姆级实战)
运维·服务器·zabbix
天庭鸡腿哥3 小时前
大小只有4K的软件,可让系统瞬间丝滑!
运维·服务器·windows·microsoft·everything
虚伪的空想家3 小时前
华为昇腾Atlas 800 A2物理服务器开启VT-d模式
运维·服务器·ubuntu·kvm·vt-d·直通
学渣676563 小时前
服务器端口映射
运维·服务器