kettle的mysql 根据条件,导出到不同的excel中

第一个Excel输出 选择 带有 defalut的字样的,第二个Excel中选择带有 new 字样的选项。

在Kettle(Pentaho Data Integration)中根据条件将MySQL数据导出到不同Excel文件,可通过以下步骤实现:

核心步骤

  1. 表输入

    连接MySQL数据库并执行SQL查询,例如:

    复制代码
    SELECT id, category, value FROM sales_data
  2. 过滤记录 (关键步骤)

    根据条件拆分数据流,例如:

    • 条件1:category = 'A' → 输出到路径A
    • 条件2:category = 'B' → 输出到路径B
    • 默认条件 → 其他路径
  3. Excel输出

    为每个分支配置独立的Excel文件:

    • 路径A:/output/sales_A.xlsx
    • 路径B:/output/sales_B.xlsx
    • 默认路径:/output/sales_other.xlsx

转换流程示例

复制代码
graph LR
    A[表输入] --> B[过滤记录]
    B -- 条件1 --> C[Excel输出 A]
    B -- 条件2 --> D[Excel输出 B]
    B -- 默认 --> E[Excel输出 Other]

详细配置说明

  1. 过滤记录设置

    • 发送true数据给步骤选择对应Excel输出步骤

    • 条件表达式示例(数值型):

      复制代码
      category = 'A'
  2. Excel输出配置

    • 文件名:使用绝对路径(如C:/export/data_A.xlsx
    • 字段映射:自动继承上游字段
    • 勾选包含头部生成表头
  3. 优化建议

    • 在表输入步骤使用WHERE预过滤数据(减少内存占用)
    • 通过字段选择删除不需要导出的列
    • 大文件导出时启用分批提交(每1万行写入一次)

注意事项

  • 确保MySQL驱动已放入Kettle的lib目录
  • Excel输出路径需有写入权限
  • 中文乱码问题可在表输入步骤设置characterEncoding=utf8
相关推荐
不剪发的Tony老师1 分钟前
国产数据库之GaussDB:固若金汤
数据库·gaussdb
雨辰AI31 分钟前
生产级实测:SpringBoot3 + 达梦数据库接口从 200ms 优化至 20ms 完整调优指南
java·数据库·spring boot·后端·政务
凡人叶枫1 小时前
Effective C++ 条款39:明智而审慎地使用 private 继承
java·数据库·c++·嵌入式开发
基德爆肝c语言1 小时前
MySQL表的操作
前端·数据库·mysql
GreatSQL1 小时前
gt-checksum v4.0.0 新功能解读系列文章(1):断点续传——大任务中断不再从头跑
mysql
TDengine (老段)1 小时前
TDengine 连接算子 — Inner/Outer/ASOF/Window Join 的实现与使用
大数据·数据库·物联网·哈希算法·时序数据库·tdengine·涛思数据
Keano Reurink2 小时前
搜索API与GSC数据对比:发现数据盲区
数据库·python·数据挖掘
shushangyun_2 小时前
汽车服务行业B2B平台+AI解决方案哪家专业:2026年最新测评
java·运维·网络·数据库·人工智能·汽车
大黄说说2 小时前
深入理解 Go 协程 Goroutine:并发编程的核心精髓
java·数据库·python
sulikey2 小时前
数据库系统概论4 - 更新与视图 期末速成课笔记
数据库·笔记·考试·期末速成·数据库系统概论