kettle下载安装于使用

一、kettle概述

1、什么是kettle

Kettle是一款开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。

2、Kettle工程存储方式

(1)以XML形式存储

(2)以资源库方式存储(数据库资源库和文件资源库)

3、Kettle的两种设计

4、Kettle的组成

5、kettle特点

二、kettle安装部署和使用

1、kettle安装地址 官网地址

官网下载需要注册,本人从CSDN博主的网盘下载的安装包。

2、Windows下安装使用

(1)概述

在实际企业开发中,都是在本地环境下进行kettle的job和Transformation开发的,可以在本地运行,也可以连接远程机器运行

(2)安装步骤

安装jdk;

下载kettle压缩包,因kettle为绿色软件,解压缩到任意本地路径即可;

双击解压后文件夹里的Spoon.bat,启动图形化界面工具,就可以直接使用了。

3、使用示例

案例需求:把stu1的数据按id同步到stu2,stu2有相同id则更新数据。

1)在mysql中创建两张表

复制代码
ysql> create database kettle;
Query OK, 1 row affected (0.00 sec)

mysql> use kettle;
Database changed

mysql>  create table stu1(id int,name varchar(20),age int);
Query OK, 0 rows affected (0.01 sec)

mysql> create table stu2(id int,name varchar(20));
Query OK, 0 rows affected (0.00 sec)

(2)往两张表中插入一些数据

复制代码
mysql> insert into stu1 values(1001,'zhangsan',20),(1002,'lisi',18), (1003,'wangwu',23);
Query OK, 3 rows affected (0.05 sec)
Records: 3  Duplicates: 0  Warnings: 0

mysql> insert into stu2 values(1001,'wukong');
Query OK, 1 row affected (0.00 sec)

备注:实际使用中,源表(stu1)与目标表(stu2)对应的字段可能相同,也可能不同。

(3)把kettle的zip安装文件拷贝到win环境中指定文件目录,解压后

在kettle中新建转换--->输入--->表输入-->表输入双击

在数据库连接栏目点击新建

在数据库连接栏目点击新建

备注:连接dm(达梦)数据库,需要将达梦数据库驱动jar包放入lib目录下,连接类型选择"Generic database",连接方式选择Native(JDBC)。



备注:如果stu2需要生成主键,上述箭头1处的sql可改为(以达梦数据库sql为例):

复制代码
select sys_guid() as uuid,* from stu1;

然后后续步骤可以将uuid与stu2主键字段映射;
如果stu2的某个字段需要常量值,上述箭头1处的sql可改为:

复制代码
select sys_guid() as uuid,'0' as status,* from stu1;

如果stu2的某个字段需要当前时间,上述箭头1处的sql可改为:

复制代码
select sys_guid() as uuid,'0' as status,sysdate as createDate,* from stu1;

以上说明stu1的数据输入ok的,现在我们需要把输入stu1的数据同步到stu2输出的数据

连接方法如下:

注意:拖出来的线条必须是深灰色才关联成功,若是浅灰色表示关联失败


备注:上图中的用来查询的关键字表示源表和目标表关联的字段,表字段为目标表,流里的字段1为源表,更新字段为需要更新的源表与目标表字段。

转换之前,需要做保存

之后,在mysql查看,stu2的数据

mysql> select * from stu2;

±-----±-------+

| id | name |

±-----±-------+

| 1001 | wukong |

| 1002 | lisi |

| 1003 | wangwu |

±-----±-------+

3 rows in set (0.00 sec)

参考文章:

https://zhuanlan.zhihu.com/p/137383200

https://blog.csdn.net/Jmayday/article/details/102860582

https://blog.csdn.net/estelle_belle/article/details/138999665

相关推荐
介一安全23 分钟前
【Frida Android】基础篇6:Java层Hook基础——创建类实例、方法重载、搜索运行时实例
android·java·网络安全·逆向·安全性测试·frida
xyy202534 分钟前
Spring事务的传播方式
java·数据库·spring
@Kerry~42 分钟前
phpstudy .htaccess 文件内容
java·开发语言·前端
roshy42 分钟前
x86、arm、rsc-v指令集架构,指令集、OS、应用3者的关系
java·arm开发·架构
CRMEB系统商城42 分钟前
CRMEB多商户系统(PHP)v3.3正式发布,同城配送上线[特殊字符]
java·开发语言·小程序·php
iナナ1 小时前
Java优选算法——位运算
java·数据结构·算法·leetcode
毕设源码-钟学长1 小时前
【开题答辩全过程】以 濒危动物保护管理系统为例,包含答辩的问题和答案
java·eclipse
Han.miracle2 小时前
数据结构二叉树——层序遍历&& 扩展二叉树的左视图
java·数据结构·算法·leetcode
Orange_sparkle2 小时前
若依使用基本步骤
java·vue
kevinfkq2 小时前
Java-idea编辑器中Jar方式打包启动
java·intellij-idea·jar