Hive JDBC

Hive远程模式搭建好之后,可以使用Beeline客户端或JDBC远程访问Hive了

启动HiveServer2服务

bash 复制代码
$ hive --service hiveserver2 &

新建Java Maven项目,在pom.xml中添加以下依赖

XML 复制代码
    <dependencies>
        <dependency>
            <groupId>jdk.tools</groupId>
            <artifactId>jdk.tools</artifactId>
            <version>1.8</version>
            <scope>system</scope>
            <systemPath>${JAVA_HOME}/lib/tools.jar</systemPath>
        </dependency>
        <!-- https://mvnrepository.com/artifact/org.apache.hbase/hbase-mapreduce -->
        <dependency>
            <groupId>org.apache.hive</groupId>
            <artifactId>hive-jdbc</artifactId>
            <version>2.3.9</version>
        </dependency>

    </dependencies>

编写JDBC程序

主要分五个步骤:

1.加载JDBC驱动

使用Class.forName()加载JDBC驱动

2.获取连接

使用DriverManager驱动管理类获取Hive连接

3.执行查询

通过Statement对象的executeQuery()方法执行查询命令

4.处理结果集

通过ResultSet对象获取返回的结果。ResultSet是JDBC用于装载返回数据的类。

5.关闭连接

关闭连接,释放资源

java 复制代码
package org.example;
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.ResultSet;
import java.sql.Statement;

/**
 * Hive JDBC 测试类
 */
public class HiveJDBCTest {
    public static void main(String[] args) throws Exception{
        // 驱动名称
        String driver = "org.apache.hive.jdbc.HiveDriver";
        // 连接地址,默认使用端口10000
        String url = "jdbc:hive2://192.168.153.133:10000/test_db";
        // 用户名(Hadoop集群的登录用户)
        String username = "hadoop";
        // 密码
        String password = "";
        // 1.接在JDBC裙动
        Class.forName(driver);
        // 2.获取连接
        Connection conn = DriverManager.getConnection(url, username, password);
        Statement stmt = conn.createStatement();
        // 3.执行查询
        ResultSet res = stmt.executeQuery("select * from t_user");
        // 4.处理结果
        while(res.next()){
            System.out.println(res.getInt(1) + "\t" + res.getString(2));
        }
        // 5.关闭连接
        res.close();
        stmt.close();
        conn.close();
    }
}
相关推荐
青云交3 小时前
大数据新视界 -- Hive 数据仓库:构建高效数据存储的基石(下)(2/ 30)
大数据·数据仓库·hive·数据安全·数据分区·数据桶·大数据存储
Lorin 洛林4 小时前
Hadoop 系列 MapReduce:Map、Shuffle、Reduce
大数据·hadoop·mapreduce
SelectDB技术团队5 小时前
兼顾高性能与低成本,浅析 Apache Doris 异步物化视图原理及典型场景
大数据·数据库·数据仓库·数据分析·doris
soso19686 小时前
DataWorks快速入门
大数据·数据仓库·信息可视化
B站计算机毕业设计超人7 小时前
计算机毕业设计SparkStreaming+Kafka旅游推荐系统 旅游景点客流量预测 旅游可视化 旅游大数据 Hive数据仓库 机器学习 深度学习
大数据·数据仓库·hadoop·python·kafka·课程设计·数据可视化
Yz987610 小时前
hive的存储格式
大数据·数据库·数据仓库·hive·hadoop·数据库开发
lzhlizihang10 小时前
python如何使用spark操作hive
hive·python·spark
武子康10 小时前
大数据-230 离线数仓 - ODS层的构建 Hive处理 UDF 与 SerDe 处理 与 当前总结
java·大数据·数据仓库·hive·hadoop·sql·hdfs
武子康10 小时前
大数据-231 离线数仓 - DWS 层、ADS 层的创建 Hive 执行脚本
java·大数据·数据仓库·hive·hadoop·mysql