etl工具

processflow流程图2 个月前
clickhouse·分布式数据库·etl工具·kettle驱动
Kettle9.4支持Clickhouse数据源插件开发以及性能测试最近业务这边有个指标需要用到大数据这边的列式数据库进行处理,由于kettle不支持clickhouse数据源驱动,这里查了一下网上的相关资料,发现了一些别人开发好的驱动包,下载下来后使用效果不尽人意。总结下来有以下几个问题:
zhangjin12225 个月前
数据仓库·etl·etl工具·kettle教程·kettle血缘·数据血缘
kettle从入门到精通 第七五课 ETL之kettle血缘,数据血缘在了解kettle血缘之前,咱们先来了解下什么是数据血缘?1、数据血缘定义(来自gpt)数据血缘(Data Lineage)是指在数据管理和数据分析中追踪数据的源头、流向和处理过程的能力。具体来说,数据血缘描述了数据如何被创建、变换和移动,以及这些过程中数据的路径和影响。它有助于理解数据的可靠性、完整性和可信度,是数据治理和合规性的重要组成部分。
processflow流程图6 个月前
分布式·etl工具·分布式kettle调度管理系统·kettle调度·kettle二开
分布式kettle调度管理平台简介Kettle(也称为Pentaho Data Integration)是一款开源的ETL(Extract, Transform, Load)工具,由Pentaho(现为Hitachi Vantara)开发和维护。它提供了一套强大的数据集成和转换功能,用于从各种数据源提取数据、进行数据转换和清洗,并将数据加载到目标系统中。
zhangjin12229 个月前
数据库·etl·nifi·etl工具
ETL工具-nifi干货系列 第八讲 处理器PutDatabaseRecord 写数据库(详细)1、本节通过一个小例子来讲解下处理器PutDatabaseRecord,该处理器的作用是将数据写入数据库。