kettle从入门到精通 第七十六课 ETL之kettle kettle连接hive教程

1、群里有小伙伴询问kettle连接hive的demo,今天抽点时间整理下。其实kettle连接hive和连接mysql数据库也是一样的。

1)kettle中的lib目录下放hive驱动jar,这里我使用的是kyuubi-hive-jdbc-shaded-1.9.0.jar。

2)设置hive连接参数。

3)通过表输入进行读取数据。

2、下载kyuubi-hive-jdbc-shaded-1.9.0.jar,放到lib目录下面,记得重启kettle spoon。否则不生效

3、设置hive连接参数,我这里只设置了ip地址、数据库名称、端口信息。如下图所示:

4、拖动表输入到画布,写日志步骤进行打印读取数据。表输入步骤选择之前设置的hive连接,填写select语句。如下图所示:

5、点击运行按钮测试,数据可以正常获取。如下图所示:

6、删除kyuubi-hive-jdbc-shaded-1.9.0.jar,重新运行,出现找不到驱动jar错误,如下图所示。

kettle支持的其他数据源也是这个流程,欢迎小伙伴们留言探讨。

相关推荐
zgl_200537798 小时前
ZGLanguage 解析SQL数据血缘 之 提取select语句中的源表名
大数据·数据库·c++·数据仓库·sql·数据库开发·etl
宸津-代码粉碎机11 小时前
Spring 6.0+Boot 3.0实战避坑全指南:5大类高频问题与解决方案(附代码示例)
java·数据仓库·hive·hadoop·python·技术文档编写
`林中水滴`12 小时前
Hive系列:Hive 默认分隔符
hive
yumgpkpm17 小时前
银行的数据智能平台和Cloudera CDP 7.3(CMP 7.3)的技术对接
数据库·人工智能·hive·hadoop·elasticsearch·数据挖掘·kafka
`林中水滴`18 小时前
Hive系列:Hive 配置项详解
hive
`林中水滴`18 小时前
Hive系列:Hive 安装和配置
hive
Hello.Reader18 小时前
Flink Catalogs 元数据统一入口、JDBC/Hive/自定义 Catalog、Time Travel、Catalog Store 与监听器
大数据·hive·flink
Hello.Reader18 小时前
Flink Modules 把自定义函数“伪装成内置函数”,以及 Core/Hive/自定义模块的加载与解析顺序
大数据·hive·flink
是阿威啊18 小时前
【用户行为归因分析项目】- 【企业级项目开发第一站】项目架构和需求设计
大数据·hive·hadoop·架构·spark·scala
`林中水滴`2 天前
Iceberg vs Hudi
数据仓库