ETL-kettle数据转换使用详解

一、excel转换成mysql

表格就按照我们刚才转换的表格来转换成MySQL数据

  1. 在MySQL数据库中创建数据库,这个根据自身情况。我就在现有test库中测试了。

  2. 根据以上步骤,新建转换。

  3. 构建流程图,选择excel输入和表输出

  4. 将两个组件连接起来

  5. 双击表输入,文件选择源文件的位置,然后点击增加,在点击【工作表】,获取工作表名称,把标签移到右边

  6. 点击「字段」选项卡,点击「获取来自头部数据的字段...」按钮,Kettle会从Excel中读取第一行字段名称。

  7. 将 age 字段的格式设置为#,register_date的格式设置为 yyyy-MM-dd HH:mm:ss。

  8. 点击「预览记录」按钮查看抽取到的数据。如果数据格式有我呢提,在调整格式

  9. 点击「确定」按钮并保存。

  10. 配置MySQL组件,双击表输出组件

    数据库连接这里 点击新建连接,配置数据库连接信息,点击测试连接,看是否成功,如果报错,看是否世缺少jdbc的驱动,去MySQL官网下载对应的驱动即可。


  11. 输入目标表的名称为:user,后续Kettle将在MySQL中创建一张名为 user 的表格。

  12. 点击下方的「SQL」按钮,可以看到Kettle会自动帮助我们生成MySQL创建表的SQL语句

    我们将age和gender字段的数据类型改为INT类型。并点击执行按钮,会自动在MySQL数据库中创建该表。可以去数据库验证下。执行完之后,点击确定并保存组件信息。

  13. 保存并执行转换

  14. 查看数据,由于ID 数据过大,需要把属性换成 bigint

相关推荐
DashingGuy17 小时前
数仓建模理论
数据仓库
像豆芽一样优秀21 小时前
Hive和Flink数据倾斜问题
大数据·数据仓库·hive·hadoop·flink
aristo_boyunv1 天前
拦截器和过滤器(理论+实操)
java·数据仓库·hadoop·servlet
元媛媛2 天前
数据仓库概要
数据仓库
cg.family2 天前
Doris 数据仓库例子
数据仓库·doris
TDengine (老段)2 天前
从 ETL 到 Agentic AI:工业数据管理变革与 TDengine IDMP 的治理之道
数据库·数据仓库·人工智能·物联网·时序数据库·etl·tdengine
镜舟科技3 天前
告别 Hadoop,拥抱 StarRocks!政采云数据平台升级之路
大数据·starrocks·数据仓库·hadoop·存算分离
YF云飞3 天前
数据仓库进化:Agent驱动数智化新范式
数据仓库·人工智能·ai
KANGBboy6 天前
hive udf 执行一次调用多次问题
数据仓库·hive·hadoop