Kettle多张表数据抽取操作步骤

一、环境准备

  1. 安装Kettle(PDI)

◦ 下载Pentaho Data Integration (Kettle)

◦ 解压并启动Spoon图形界面


二、创建转换流程

1、把需要抽取的表名称复制至 Excel 表格,将表头定义为"table_name",如下图所示:

新建excel

2、创建转换 a,同时进行 Excel 输入的创建操作,具体情形如下图所示:

复制结果到记录,具体情况如下图所示:

3、创建转换b

从结果获取记录,如下图:

设置变量,如下图

4、创建转换c

创建数据库连接,如下图(如果需要在其他转换中使用,可以在配置好的数据库连接信息上右键共享):

创建表输入,如下图:

创建表输出,如下图:

5、创建作业1

配置第一个转换

配置第二个转换

最终如下图:(创建完可以执行,看是否报错)

作业1

6、创建作业

创建作业,如下图:

作业信息配置

最终如下图:

最终结果


三、执行与调度

立即执行测试

  1. 点击运行按钮(▶)

  2. 选择"本地执行"

  3. 查看执行结果和日志


四、常见问题解决

  1. 数据库连接失败
  • 检查JDBC驱动是否放入lib文件夹
  • 验证连接字符串和权限

2、字段映射错误

  • 使用"字段选择"统一字段名
  • 检查数据类型兼容性
相关推荐
怣504 分钟前
MySQL多表连接:全外连接、交叉连接与结果集合并详解
数据库·sql
wjhx25 分钟前
QT中对蓝牙权限的申请,整理一下
java·数据库·qt
秃了也弱了。27 分钟前
StarRocks:高性能分析型数据仓库
数据仓库
冰暮流星36 分钟前
javascript之二重循环练习
开发语言·javascript·数据库
万岳科技系统开发1 小时前
食堂采购系统源码库存扣减算法与并发控制实现详解
java·前端·数据库·算法
心疼你的一切1 小时前
数字智人:CANN加速的实时数字人生成与交互
数据仓库·深度学习·aigc·交互·cann
冉冰学姐1 小时前
SSM智慧社区管理系统jby69(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面
数据库·管理系统·智慧社区·ssm 框架
杨超越luckly1 小时前
HTML应用指南:利用GET请求获取中国500强企业名单,揭秘企业增长、分化与转型的新常态
前端·数据库·html·可视化·中国500强
Elastic 中国社区官方博客1 小时前
Elasticsearch:Workflows 介绍 - 9.3
大数据·数据库·人工智能·elasticsearch·ai·全文检索