kettle从入门到精通 第七十六课 ETL之kettle kettle连接hive教程

1、群里有小伙伴询问kettle连接hive的demo,今天抽点时间整理下。其实kettle连接hive和连接mysql数据库也是一样的。

1)kettle中的lib目录下放hive驱动jar,这里我使用的是kyuubi-hive-jdbc-shaded-1.9.0.jar。

2)设置hive连接参数。

3)通过表输入进行读取数据。

2、下载kyuubi-hive-jdbc-shaded-1.9.0.jar,放到lib目录下面,记得重启kettle spoon。否则不生效

3、设置hive连接参数,我这里只设置了ip地址、数据库名称、端口信息。如下图所示:

4、拖动表输入到画布,写日志步骤进行打印读取数据。表输入步骤选择之前设置的hive连接,填写select语句。如下图所示:

5、点击运行按钮测试,数据可以正常获取。如下图所示:

6、删除kyuubi-hive-jdbc-shaded-1.9.0.jar,重新运行,出现找不到驱动jar错误,如下图所示。

kettle支持的其他数据源也是这个流程,欢迎小伙伴们留言探讨。

相关推荐
晴天彩虹雨8 小时前
实时数仓体系概览与架构演进
数据仓库·clickhouse·架构·flink·kafka
和算法死磕到底17 小时前
ubantu18.04(Hadoop3.1.3)Hive3.1.2安装指南
大数据·数据库·hive·hadoop·mysql·hdfs·dubbo
骇客野人19 小时前
数据仓库ODS、DWD、DWS、ADS各层介绍
数据仓库
不剪发的Tony老师1 天前
Apache SeaTunnel:新一代开源、高性能数据集成工具
etl·数据集成
白-胖-子2 天前
快速认识:数据库、数仓(数据仓库)、数据湖与数据运河
大数据·linux·数据库·数据仓库·人工智能
zhang98800002 天前
利用java语言,怎样开发和利用各种开源库和内部/自定义框架,实现“提取-转换-加载”(ETL)流程的自动化
java·开源·etl
RestCloud2 天前
2025年五大ETL数据集成工具推荐
数据仓库·etl·数字化转型·数据集成·数据集成平台·informatica·talend
IT成长日记2 天前
【Hive入门】Hive架构与组件深度解析:从核心组件到生态协同
hive·hadoop·架构·架构与组件
D愿你归来仍是少年2 天前
使用 PySpark 批量清理 Hive 表历史分区
大数据·数据仓库·hive·spark
chat2tomorrow2 天前
数据仓库 vs 数据湖:架构、应用场景与技术差异全解析
大数据·数据仓库·低代码·架构·数据湖·sql2api