Kettle多张表数据抽取操作步骤

一、环境准备

  1. 安装Kettle(PDI)

◦ 下载Pentaho Data Integration (Kettle)

◦ 解压并启动Spoon图形界面


二、创建转换流程

1、把需要抽取的表名称复制至 Excel 表格,将表头定义为"table_name",如下图所示:

新建excel

2、创建转换 a,同时进行 Excel 输入的创建操作,具体情形如下图所示:

复制结果到记录,具体情况如下图所示:

3、创建转换b

从结果获取记录,如下图:

设置变量,如下图

4、创建转换c

创建数据库连接,如下图(如果需要在其他转换中使用,可以在配置好的数据库连接信息上右键共享):

创建表输入,如下图:

创建表输出,如下图:

5、创建作业1

配置第一个转换

配置第二个转换

最终如下图:(创建完可以执行,看是否报错)

作业1

6、创建作业

创建作业,如下图:

作业信息配置

最终如下图:

最终结果


三、执行与调度

立即执行测试

  1. 点击运行按钮(▶)

  2. 选择"本地执行"

  3. 查看执行结果和日志


四、常见问题解决

  1. 数据库连接失败
  • 检查JDBC驱动是否放入lib文件夹
  • 验证连接字符串和权限

2、字段映射错误

  • 使用"字段选择"统一字段名
  • 检查数据类型兼容性
相关推荐
Apple_羊先森5 分钟前
ORACLE数据库巡检SQL脚本--19、磁盘读次数最高的前5条SQL语句
数据库·sql·oracle
全栈前端老曹42 分钟前
【MongoDB】Node.js 集成 —— Mongoose ORM、Schema 设计、Model 操作
前端·javascript·数据库·mongodb·node.js·nosql·全栈
神梦流1 小时前
ops-math 算子库的扩展能力:高精度与复数运算的硬件映射策略
服务器·数据库
让学习成为一种生活方式1 小时前
trf v4.09.1 安装与使用--生信工具42-version2
数据库
啦啦啦_99991 小时前
Redis-5-doFormatAsync()方法
数据库·redis·c#
生产队队长1 小时前
Redis:Windows环境安装Redis,并将 Redis 进程注册为服务
数据库·redis·缓存
老邓计算机毕设1 小时前
SSM找学互助系统52568(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面
数据库·ssm 框架·javaweb 毕业设计
痴儿哈哈1 小时前
自动化机器学习(AutoML)库TPOT使用指南
jvm·数据库·python
十月南城1 小时前
Hive与离线数仓方法论——分层建模、分区与桶的取舍与查询代价
数据仓库·hive·hadoop
Σίσυφος19002 小时前
PCL法向量估计 之 方向约束法向量(Orientation Guided Normal)
数据库