Kettle多张表数据抽取操作步骤

一、环境准备

  1. 安装Kettle(PDI)

◦ 下载Pentaho Data Integration (Kettle)

◦ 解压并启动Spoon图形界面


二、创建转换流程

1、把需要抽取的表名称复制至 Excel 表格,将表头定义为"table_name",如下图所示:

新建excel

2、创建转换 a,同时进行 Excel 输入的创建操作,具体情形如下图所示:

复制结果到记录,具体情况如下图所示:

3、创建转换b

从结果获取记录,如下图:

设置变量,如下图

4、创建转换c

创建数据库连接,如下图(如果需要在其他转换中使用,可以在配置好的数据库连接信息上右键共享):

创建表输入,如下图:

创建表输出,如下图:

5、创建作业1

配置第一个转换

配置第二个转换

最终如下图:(创建完可以执行,看是否报错)

作业1

6、创建作业

创建作业,如下图:

作业信息配置

最终如下图:

最终结果


三、执行与调度

立即执行测试

  1. 点击运行按钮(▶)

  2. 选择"本地执行"

  3. 查看执行结果和日志


四、常见问题解决

  1. 数据库连接失败
  • 检查JDBC驱动是否放入lib文件夹
  • 验证连接字符串和权限

2、字段映射错误

  • 使用"字段选择"统一字段名
  • 检查数据类型兼容性
相关推荐
被摘下的星星9 小时前
MySQL count()函数的用法
数据库·mysql
末央&9 小时前
【天机论坛】项目环境搭建和数据库设计
java·数据库
徒 花9 小时前
数据库知识复习07
数据库·作业
素玥10 小时前
实训5 python连接mysql数据库
数据库·python·mysql
jnrjian10 小时前
text index 查看index column index定义 index 刷新频率 index视图
数据库·oracle
瀚高PG实验室10 小时前
审计策略修改
网络·数据库·瀚高数据库
言慢行善10 小时前
sqlserver模糊查询问题
java·数据库·sqlserver
韶博雅11 小时前
emcc24ai
开发语言·数据库·python
有想法的py工程师11 小时前
PostgreSQL 分区表排序优化:Append Sort 优化为 Merge Append
大数据·数据库·postgresql
迷枫71211 小时前
达梦数据库的体系架构
数据库·oracle·架构