Hive JDBC

Hive远程模式搭建好之后,可以使用Beeline客户端或JDBC远程访问Hive了

启动HiveServer2服务

bash 复制代码
$ hive --service hiveserver2 &

新建Java Maven项目,在pom.xml中添加以下依赖

XML 复制代码
    <dependencies>
        <dependency>
            <groupId>jdk.tools</groupId>
            <artifactId>jdk.tools</artifactId>
            <version>1.8</version>
            <scope>system</scope>
            <systemPath>${JAVA_HOME}/lib/tools.jar</systemPath>
        </dependency>
        <!-- https://mvnrepository.com/artifact/org.apache.hbase/hbase-mapreduce -->
        <dependency>
            <groupId>org.apache.hive</groupId>
            <artifactId>hive-jdbc</artifactId>
            <version>2.3.9</version>
        </dependency>

    </dependencies>

编写JDBC程序

主要分五个步骤:

1.加载JDBC驱动

使用Class.forName()加载JDBC驱动

2.获取连接

使用DriverManager驱动管理类获取Hive连接

3.执行查询

通过Statement对象的executeQuery()方法执行查询命令

4.处理结果集

通过ResultSet对象获取返回的结果。ResultSet是JDBC用于装载返回数据的类。

5.关闭连接

关闭连接,释放资源

java 复制代码
package org.example;
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.ResultSet;
import java.sql.Statement;

/**
 * Hive JDBC 测试类
 */
public class HiveJDBCTest {
    public static void main(String[] args) throws Exception{
        // 驱动名称
        String driver = "org.apache.hive.jdbc.HiveDriver";
        // 连接地址,默认使用端口10000
        String url = "jdbc:hive2://192.168.153.133:10000/test_db";
        // 用户名(Hadoop集群的登录用户)
        String username = "hadoop";
        // 密码
        String password = "";
        // 1.接在JDBC裙动
        Class.forName(driver);
        // 2.获取连接
        Connection conn = DriverManager.getConnection(url, username, password);
        Statement stmt = conn.createStatement();
        // 3.执行查询
        ResultSet res = stmt.executeQuery("select * from t_user");
        // 4.处理结果
        while(res.next()){
            System.out.println(res.getInt(1) + "\t" + res.getString(2));
        }
        // 5.关闭连接
        res.close();
        stmt.close();
        conn.close();
    }
}
相关推荐
RestCloud2 小时前
2026年企业级ETL工具选型指南:从开源DataX到商业化ETLCloud的演进
数据仓库·开源·etl·datax·数据处理·数据集成·数据传输
荒川之神2 小时前
Oracle 数据仓库星座模型(Galaxy Model)设计原则
数据库·数据仓库·oracle
瀚高PG实验室4 小时前
ETL中,分区表子表未及时收集统计信息,导致sql执行耗时很长
数据库·数据仓库·sql·etl·瀚高数据库
仗剑_走天涯4 小时前
hadoop reduce阶段 对象重用问题
大数据·hadoop·分布式
荒川之神5 小时前
Oracle 数据仓库雪花模型设计原则(核心 + 落地 + Oracle 数据库适配)
数据库·数据仓库·oracle
荒川之神5 小时前
Oracle 数据仓库星型模型设计原则
数据库·数据仓库·oracle
仗剑_走天涯6 小时前
hadoop 中 yarn node -list 显示0 问题解决
大数据·hadoop·分布式
武子康1 天前
大数据-263 实时数仓-Canal 增量订阅与消费原理:MySQL Binlog 数据同步实践
大数据·hadoop·后端
仗剑_走天涯2 天前
zookeeper 安装与配置
hadoop·zookeeper
zhixingheyi_tian2 天前
hdfs.c 之解析
c语言·hadoop·hdfs