Kettle多张表数据抽取操作步骤

一、环境准备

  1. 安装Kettle(PDI)

◦ 下载Pentaho Data Integration (Kettle)

◦ 解压并启动Spoon图形界面


二、创建转换流程

1、把需要抽取的表名称复制至 Excel 表格,将表头定义为"table_name",如下图所示:

新建excel

2、创建转换 a,同时进行 Excel 输入的创建操作,具体情形如下图所示:

复制结果到记录,具体情况如下图所示:

3、创建转换b

从结果获取记录,如下图:

设置变量,如下图

4、创建转换c

创建数据库连接,如下图(如果需要在其他转换中使用,可以在配置好的数据库连接信息上右键共享):

创建表输入,如下图:

创建表输出,如下图:

5、创建作业1

配置第一个转换

配置第二个转换

最终如下图:(创建完可以执行,看是否报错)

作业1

6、创建作业

创建作业,如下图:

作业信息配置

最终如下图:

最终结果


三、执行与调度

立即执行测试

  1. 点击运行按钮(▶)

  2. 选择"本地执行"

  3. 查看执行结果和日志


四、常见问题解决

  1. 数据库连接失败
  • 检查JDBC驱动是否放入lib文件夹
  • 验证连接字符串和权限

2、字段映射错误

  • 使用"字段选择"统一字段名
  • 检查数据类型兼容性
相关推荐
GBASE18 小时前
G术时刻 |GBase 8s数据库事务并发控制之封锁技术介绍(下)
数据库
xiezhr1 天前
逛GitHub发现了一款免费的带AI功能的数据库管理工具
数据库·ai编程·dba
吃糖的小孩2 天前
给 QQ AI 机器人设计“可控记忆”:会话摘要、手动长期记忆与角色卡边界
数据库
笃行3503 天前
金仓数据库数据安全双防线:静态存储加密与传输加密实战
数据库
笃行3503 天前
金仓数据库物理备份实战:sys_rman 全流程演练与误覆盖抢救
数据库
笃行3503 天前
金仓数据库逻辑备份实战:从全库导出到 Schema 替换的完整闭环
数据库
SelectDB4 天前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据·数据库·aigc
这个DBA有点耶4 天前
GROUP BY优化全解:如何写出既不丢数据又飞快的分组查询
数据库·mysql·架构
掉头发的王富贵4 天前
【StarRocks】极限十分钟入门StarRocks
数据库·sql·mysql