ubantu18.04（Hadoop3.1.3）Hive3.1.2安装指南

说明：本文图片较多，耐心等待加载。（建议用电脑）

注意所有打开的文件都要记得保存。本文的操作均在Master主机下进行

第一步：准备工作

本文是在之前Hadoop搭建完集群环境后继续进行的，因此需要读者完成我之前教程的所有操作。

准备我们的 Hive安装包文件和mysql jdbc 包

首先需要下载Hive安装包文件， Hive官网下载地址
也可以直接点击这里从百度云盘下载软件（提取码：ziyu）。进入百度网盘后，进入"软件"目录，找到apache-hive-3.1.2-bin.tar.gz文件，下载到本地。

https://dev.mysql.com/downloads/connector/j/mysql jdbc 包https://dev.mysql.com/downloads/connector/j/

我这里呢从网盘直接下载的，因为我从官网没有看到所需要的版本。大家可以找我拿，或者也从网盘下，也很快。

然后我们将下载好的两个文件放到之前的共享文件夹（之前都讲过，可以在第一章看到）

然后拖到下载里

第二步：安装Hive3.1.2

1.将两台虚拟机都启动。

2.下载并解压Hive安装包

进去Master终端，（右键-》打开终端）(注意下面的最后一个命令是你自己的用户名)

注意中文版是下载，英文版是DownLoads）

bash 复制代码

cd ~/下载
sudo tar -zxvf ./apache-hive-3.1.2-bin.tar.gz -C /usr/local   # 解压到/usr/local中
cd /usr/local/
sudo mv apache-hive-3.1.2-bin hive       # 将文件夹名改为hive
sudo chown -R hadoop-202202810203:hadoop-220202810203 hive

3. 配置环境变量

继续在终端输入以下命令

bash 复制代码

vim ~/.bashrc

export HIVE_HOME=/usr/local/hive

export PATH= $PATH:/usr/local/hadoop/sbin:/usr/local/hadoop/bin:/usr/local/hbase/bin:$ HIVE_HOME/bin

将之前的内容替换为以上内容。

保存退出，继续输入：

bash 复制代码

source ~/.bashrc

4.修改 /usr/local/hive/conf 下的hive-site.xml

继续输入以下内容"

bash 复制代码

cd /usr/local/hive/conf
mv hive-default.xml.template hive-default.xml

bash 复制代码

cd /usr/local/hive/conf
vim hive-site.xml

在hive-site.xml中添加如下配置信息：

<?xml version="1.0" encoding="UTF-8" standalone="no"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://localhost:3306/hive?useSSL=false&createDatabaseIfNotExist=true</value>
<description>JDBC connect string for a JDBC metastore</description>
</property

<property>

<name>javax.jdo.option.ConnectionDriverName</name>

<value>com.mysql.jdbc.Driver</value>

<description>Driver class name for a JDBC metastore</description>

</property>

<property>

<name>javax.jdo.option.ConnectionUserName</name>

<value>hive</value>

<description>username to use against metastore database</description>

</property>

<property>

<name>javax.jdo.option.ConnectionPassword</name>

<value>hive</value>

<description>password to use against metastore database</description>

</property>

</configuration>

然后，按键盘上的"ESC"键退出vim编辑状态，再输入:wq，保存并退出vim编辑器。

第三步：安装并配置mysql

1.Ubuntu下mysql

在终端继续执行以下命令：

bash 复制代码

cd ~
sudo apt update
sudo apt install mysql-server

按下Y回车

安装完成后，启动mysql

bash 复制代码

sudo systemctl start mysql

为了方便之后的登录，我们先修改 MySQL 的 root 用户认证方式

1. 用 `sudo` 登录 MySQL：

bash 复制代码

sudo mysql

2. 修改 root 用户的验证方式为 `mysql_native_password`：

bash 复制代码

ALTER USER 'root'@'localhost' IDENTIFIED WITH mysql_native_password BY '123456';

4. 现在再用密码登录试试：（密码是我们刚刚设置的123456）

bash 复制代码

mysql -u root -p

然后输入你的密码123456。

5.mysql jdbc 包

输入exit退出mysql

bash 复制代码

exit;

我们继续在终端输入以下命令（注意中文版是下载，英文版是DownLoads）

bash 复制代码

cd ~/下载
tar -zxvf mysql-connector-java-5.1.40.tar.gz   #解压
cp mysql-connector-java-5.1.40/mysql-connector-java-5.1.40-bin.jar  /usr/local/hive/lib #将mysql-connector-java-5.1.40-bin.jar拷贝到/usr/local/hive/lib目录下

6.新建hive数据库。

bash 复制代码

 mysql -u root -p

输入密码123456登录到mysql输入下面的命令

bash 复制代码

create database hive;    #这个hive数据库与hive-site.xml中localhost:3306/hive的hive对应，用来保存hive元数据

7.配置mysql允许hive接入：

继续在mysql输入以下内容：

bash 复制代码

grant all on *.* to hive@localhost identified by 'hive';   #将所有数据库的所有表的所有权限赋给hive用户，后面的hive是配置hive-site.xml中配置的连接密码

bash 复制代码

flush privileges;  #刷新mysql系统权限关系表

这里忘了截屏了，应该不会出错，然后记得Exit

8.启动hive

启动hive之前，请先启动hadoop集群。

1.进去Master终端，（右键-》打开终端），启动，并用jps检查是否成功启动

bash 复制代码

start-dfs.sh
start-yarn.sh
mr-jobhistory-daemon.sh start historyserver

我们再启动是会报错，为了避免报错，我们进行如下操作

2. 在终端继续输入以下命令：

bash 复制代码

find /usr/local/hive/ -name "guava*.jar"
find /usr/local/hadoop/ -name "guava*.jar"

如果两个一样，你可以跳过这一步。不一样就执行以下命令：（注意下面的版本号用自己的）

bash 复制代码

rm /usr/local/hive/lib/guava-19.0.jar

bash 复制代码

cp /usr/local/hadoop/share/hadoop/common/lib/guava-27.0-jre.jar /usr/local/hive/lib/

3.在终端继续输入以下命令：

bash 复制代码

cd /usr/local/hive

bash 复制代码

schematool -dbType mysql -initSchema

4.启动，在终端输入

bash 复制代码

hive  #启动hive

启动进入Hive的交互式执行环境以后，会出现如下命令提示符：

bash 复制代码

hive>

第四步：Hive的常用HiveQL操作

这一个我单独成一章，大家可以在我的专栏里看到。我这里直接进行下一步。

第五步：Hive简单编程实践

退出上面的hive，（输入exit）在终端继续输入下面的命令

1. 1）创建input目录，output目录会自动生成。其中input为输入目录，output目录为输出目录。命令如下：

bash 复制代码

cd /usr/local/hadoop
mkdir input

2）然后，在input文件夹中创建两个测试文件file1.txt和file2.txt，命令如下：

bash 复制代码

cd  /usr/local/hadoop/input
echo "hello world" > file1.txt
echo "hello hadoop" > file2.txt

为了后续区分，我们之前有好多文件都弄到一个目录里了，这里我们新创建 HDFS 目标目录

创建 HDFS 目标目录（如果未创建）

bash 复制代码

hdfs dfs -mkdir -p /user/hadoop/input2

将本地文件上传到 HDFS

bash 复制代码

hadoop fs -put /usr/local/hadoop/input/file1.txt /user/hadoop/input2/
hadoop fs -put /usr/local/hadoop/input/file2.txt /user/hadoop/input2/

3）执行如下hadoop命令：

bash 复制代码

cd  ..
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /user/hadoop/input2 /user/hadoop/output2

bash 复制代码

./bin/hdfs dfs -cat /user/hadoop/output2/*

下面我们通过HiveQL实现词频统计功能，此时只要编写下面7行代码，而且不需要进行编译生成jar来执行。HiveQL实现命令如下：

我们先进入hive，直接启动

在终端输入

bash 复制代码

hive

1. 创建表 `docs`

首先创建一个表 docs，它将存储每一行文本

bash 复制代码

create table docs(line string);

2. 将文件数据加载到表中

然后，使用 LOAD DATA 命令将本地文件系统中的数据加载到 docs 表中。这里的路径 'file:///usr/local/hadoop/input' 是文件存放路径。

bash 复制代码

load data inpath 'file:///usr/local/hadoop/input' overwrite into table docs;

3. 创建表 `word_count` 并统计词频

在创建表 word_count 时，HiveQL 查询会：

使用 explode 和 split 函数将每行文本按空格分割为单词，并将其作为 word 列。
对每个单词进行计数，并按字母顺序排序。

bash 复制代码

create table word_count as select word, count(1) as count from (select explode(split(line, ' ')) as word from docs) w group by word order by word;

详细步骤解释：

split(line, ' ') ：使用 split 函数将 line 列的每一行文本按空格切割成单词。
explode() ：explode 将每个文本行拆分成多个单词，每个单词成为一行数据。
group by word ：按 word 列分组，并使用 count(1) 来计算每个单词的出现次数。
order by word：按字母顺序对单词进行排序.

继续在终端输入：

bash 复制代码

select * from word_count;

出现如上界面即为成功。

ubantu18.04（Hadoop3.1.3）Hive3.1.2安装指南

说明：本文图片较多，耐心等待加载。（建议用电脑）

第一步：准备工作

第二步：安装Hive3.1.2

1.将两台虚拟机都启动。

2.下载并解压Hive安装包

进去Master终端，（右键-》打开终端）(注意下面的最后一个命令是你自己的用户名)

3. 配置环境变量

4.修改 /usr/local/hive/conf 下的hive-site.xml

继续输入以下内容"

第三步：安装并配置mysql

1.Ubuntu下mysql

1. 用 `sudo` 登录 MySQL：

2. 修改 root 用户的验证方式为 `mysql_native_password`：

4. 现在再用密码登录试试：（密码是我们刚刚设置的123456）

5.mysql jdbc 包

6.新建hive数据库。

7.配置mysql允许hive接入：

8.启动hive

1.进去Master终端，（右键-》打开终端），启动，并用jps检查是否成功启动

2. 在终端继续输入以下命令：

3.在终端继续输入以下命令：

4.启动，在终端输入

第四步：Hive的常用HiveQL操作

第五步：Hive简单编程实践

为了后续区分，我们之前有好多文件都弄到一个目录里了，这里我们新创建 HDFS 目标目录

将本地文件上传到 HDFS

1. 创建表 `docs`

2. 将文件数据加载到表中

3. 创建表 `word_count` 并统计词频

结语：整体的操作步我都给大家写出来，并且截图了，大家只需要无脑粘贴就好了，具体的讲解可以看我的资料里的文档解释更加详细，这个实验就结束了。

上面内容制作不易，喜欢的点个赞和收藏支持一下吧！！

后期会持续更新更多大数据内容，如果想共同学习，就点点关注把（

ubantu18.04（Hadoop3.1.3）Hive3.1.2安装指南

说明：本文图片较多，耐心等待加载。（建议用电脑）

第一步：准备工作

第二步：安装Hive3.1.2

1.将两台虚拟机都启动。

2.下载并解压Hive安装包

进去Master终端，（右键-》打开终端）(注意下面的最后一个命令是你自己的用户名)

3. 配置环境变量

4.修改 /usr/local/hive/conf 下的hive-site.xml

继续输入以下内容"

第三步：安装并配置mysql

1.Ubuntu下mysql

1. 用 sudo 登录 MySQL：

2. 修改 root 用户的验证方式为 mysql_native_password：

4. 现在再用密码登录试试：（密码是我们刚刚设置的123456）

5.mysql jdbc 包

6.新建hive数据库 。

7.配置mysql允许hive接入：

8.启动hive

1.进去Master终端，（右键-》打开终端），启动，并用jps检查是否成功启动

2. 在终端继续输入以下命令：

3.在终端继续输入以下命令：

4.启动，在终端输入

第四步：Hive的常用HiveQL操作

第五步：Hive简单编程实践

为了后续区分，我们之前有好多文件都弄到一个目录里了，这里我们新创建 HDFS 目标目录

将本地文件上传到 HDFS

1. 创建表 docs

2. 将文件数据加载到表中

3. 创建表 word_count 并统计词频

结语：整体的操作步我都给大家写出来，并且截图了，大家只需要无脑粘贴就好了，具体的讲解可以看我的资料里的文档解释更加详细，这个实验就结束了。

上面内容制作不易，喜欢的点个赞和收藏支持一下吧！！

后期会持续更新更多大数据内容，如果想共同学习，就点点关注把（

1. 用 `sudo` 登录 MySQL：

2. 修改 root 用户的验证方式为 `mysql_native_password`：

6.新建hive数据库。

1. 创建表 `docs`

3. 创建表 `word_count` 并统计词频