ETL-kettle数据转换使用详解

一、excel转换成mysql

表格就按照我们刚才转换的表格来转换成MySQL数据

  1. 在MySQL数据库中创建数据库,这个根据自身情况。我就在现有test库中测试了。

  2. 根据以上步骤,新建转换。

  3. 构建流程图,选择excel输入和表输出

  4. 将两个组件连接起来

  5. 双击表输入,文件选择源文件的位置,然后点击增加,在点击【工作表】,获取工作表名称,把标签移到右边

  6. 点击「字段」选项卡,点击「获取来自头部数据的字段...」按钮,Kettle会从Excel中读取第一行字段名称。

  7. 将 age 字段的格式设置为#,register_date的格式设置为 yyyy-MM-dd HH:mm:ss。

  8. 点击「预览记录」按钮查看抽取到的数据。如果数据格式有我呢提,在调整格式

  9. 点击「确定」按钮并保存。

  10. 配置MySQL组件,双击表输出组件

    数据库连接这里 点击新建连接,配置数据库连接信息,点击测试连接,看是否成功,如果报错,看是否世缺少jdbc的驱动,去MySQL官网下载对应的驱动即可。


  11. 输入目标表的名称为:user,后续Kettle将在MySQL中创建一张名为 user 的表格。

  12. 点击下方的「SQL」按钮,可以看到Kettle会自动帮助我们生成MySQL创建表的SQL语句

    我们将age和gender字段的数据类型改为INT类型。并点击执行按钮,会自动在MySQL数据库中创建该表。可以去数据库验证下。执行完之后,点击确定并保存组件信息。

  13. 保存并执行转换

  14. 查看数据,由于ID 数据过大,需要把属性换成 bigint

相关推荐
workflower3 小时前
以光量子为例,详解量子获取方式
数据仓库·人工智能·软件工程·需求分析·量子计算·软件需求
weixin_472339464 小时前
Doris查询Hive数据:实现高效跨数据源分析的实践指南
数据仓库·hive·hadoop
fydw_71521 小时前
使用 Unstructured 开源库快速入门指南
etl
SelectDB技术团队1 天前
从 ClickHouse、Druid、Kylin 到 Doris:网易云音乐 PB 级实时分析平台降本增效
大数据·数据仓库·clickhouse·kylin·实时分析
Leo.yuan1 天前
API是什么意思?如何实现开放API?
大数据·运维·数据仓库·人工智能·信息可视化
workflower1 天前
量子比特实现方式
数据仓库·服务发现·需求分析·量子计算·软件需求
青春之我_XP2 天前
【基于阿里云搭建数据仓库(离线)】Data Studio创建资源与函数
大数据·数据仓库·sql·dataworks·maxcompute·data studio
Leo.yuan2 天前
实时数据仓库是什么?数据仓库设计怎么做?
大数据·数据库·数据仓库·数据分析·spark
涤生大数据4 天前
Apache Doris 在数据仓库中的作用与应用实践
数据仓库·apache·doris
weixin_307779134 天前
Neo4j 数据可视化与洞察获取:原理、技术与实践指南
信息可视化·架构·数据分析·neo4j·etl