kettle从入门到精通 第七十六课 ETL之kettle kettle连接hive教程

1、群里有小伙伴询问kettle连接hive的demo,今天抽点时间整理下。其实kettle连接hive和连接mysql数据库也是一样的。

1)kettle中的lib目录下放hive驱动jar,这里我使用的是kyuubi-hive-jdbc-shaded-1.9.0.jar。

2)设置hive连接参数。

3)通过表输入进行读取数据。

2、下载kyuubi-hive-jdbc-shaded-1.9.0.jar,放到lib目录下面,记得重启kettle spoon。否则不生效

3、设置hive连接参数,我这里只设置了ip地址、数据库名称、端口信息。如下图所示:

4、拖动表输入到画布,写日志步骤进行打印读取数据。表输入步骤选择之前设置的hive连接,填写select语句。如下图所示:

5、点击运行按钮测试,数据可以正常获取。如下图所示:

6、删除kyuubi-hive-jdbc-shaded-1.9.0.jar,重新运行,出现找不到驱动jar错误,如下图所示。

kettle支持的其他数据源也是这个流程,欢迎小伙伴们留言探讨。

相关推荐
AI悦创|编程1v12 天前
00-1-正则表达式学习心得:从入门到上瘾,再到克制
数据仓库·正则表达式·数据挖掘·ai悦创编程一对一教学·python一对一辅导·python一对一教学
DashingGuy2 天前
hive、spark任务报错或者异常怎么排查以及定位哪段sql
hive·sql·spark
DashingGuy2 天前
数仓各层级设计总结
数据仓库
DashingGuy2 天前
从0-1建设数据仓库
数据仓库
数据要素X2 天前
【大数据实战】如何从0到1构建用户画像系统(案例+数据仓库+Airflow调度)
大数据·数据仓库·数据治理·数据中台
西岭千秋雪_4 天前
RAG核心特性:ETL
数据仓库·人工智能·spring boot·ai编程·etl
Hello.Reader4 天前
优化 Flink 基于状态的 ETL少 Shuffle、不膨胀、可落地的工程
flink·php·etl
孟意昶5 天前
Spark专题-第三部分:性能监控与实战优化(1)-认识spark ui
大数据·数据仓库·sql·ui·spark·etl
LgZhu(Yanker)5 天前
40、企业智能决策引擎:BI分析平台的架构设计与业务实践
信息可视化·数据分析·etl·bi·大屏