kettle从入门到精通 第七十六课 ETL之kettle kettle连接hive教程

1、群里有小伙伴询问kettle连接hive的demo,今天抽点时间整理下。其实kettle连接hive和连接mysql数据库也是一样的。

1)kettle中的lib目录下放hive驱动jar,这里我使用的是kyuubi-hive-jdbc-shaded-1.9.0.jar。

2)设置hive连接参数。

3)通过表输入进行读取数据。

2、下载kyuubi-hive-jdbc-shaded-1.9.0.jar,放到lib目录下面,记得重启kettle spoon。否则不生效

3、设置hive连接参数,我这里只设置了ip地址、数据库名称、端口信息。如下图所示:

4、拖动表输入到画布,写日志步骤进行打印读取数据。表输入步骤选择之前设置的hive连接,填写select语句。如下图所示:

5、点击运行按钮测试,数据可以正常获取。如下图所示:

6、删除kyuubi-hive-jdbc-shaded-1.9.0.jar,重新运行,出现找不到驱动jar错误,如下图所示。

kettle支持的其他数据源也是这个流程,欢迎小伙伴们留言探讨。

相关推荐
KANGBboy3 天前
hive udf 执行一次调用多次问题
数据仓库·hive·hadoop
来杯雀巢咖啡4 天前
ubantu安装配置hive
数据仓库·hive·hadoop
RestCloud5 天前
10迁移TiDB数据库数据到GaussDB
数据库·tidb·etl·gaussdb·数据处理·数据同步·集成平台
chad__chang5 天前
HIVE的Window functions窗口函数【二】
数据仓库·hive·hadoop
張萠飛5 天前
hive on tez为什么写表时,要写临时文件到hdfs目录
hive·hadoop·hdfs
秉寒-CHO5 天前
5w2h构建数据仓库与sow
大数据·数据仓库
白日与明月6 天前
Hive中的with子句
数据仓库·hive
步行cgn6 天前
Servlet 注解:简化配置的完整指南
hive·hadoop·servlet
喻师傅8 天前
横扫SQL面试——流量与转化率分类
大数据·数据仓库·sql