技术栈
etl工具
processflow流程图
2 个月前
clickhouse
·
分布式数据库
·
etl工具
·
kettle驱动
Kettle9.4支持Clickhouse数据源插件开发以及性能测试
最近业务这边有个指标需要用到大数据这边的列式数据库进行处理,由于kettle不支持clickhouse数据源驱动,这里查了一下网上的相关资料,发现了一些别人开发好的驱动包,下载下来后使用效果不尽人意。总结下来有以下几个问题:
zhangjin1222
5 个月前
数据仓库
·
etl
·
etl工具
·
kettle教程
·
kettle血缘
·
数据血缘
kettle从入门到精通 第七五课 ETL之kettle血缘,数据血缘
在了解kettle血缘之前,咱们先来了解下什么是数据血缘?1、数据血缘定义(来自gpt)数据血缘(Data Lineage)是指在数据管理和数据分析中追踪数据的源头、流向和处理过程的能力。具体来说,数据血缘描述了数据如何被创建、变换和移动,以及这些过程中数据的路径和影响。它有助于理解数据的可靠性、完整性和可信度,是数据治理和合规性的重要组成部分。
processflow流程图
6 个月前
分布式
·
etl工具
·
分布式kettle调度管理系统
·
kettle调度
·
kettle二开
分布式kettle调度管理平台简介
Kettle(也称为Pentaho Data Integration)是一款开源的ETL(Extract, Transform, Load)工具,由Pentaho(现为Hitachi Vantara)开发和维护。它提供了一套强大的数据集成和转换功能,用于从各种数据源提取数据、进行数据转换和清洗,并将数据加载到目标系统中。
zhangjin1222
9 个月前
数据库
·
etl
·
nifi
·
etl工具
ETL工具-nifi干货系列 第八讲 处理器PutDatabaseRecord 写数据库(详细)
1、本节通过一个小例子来讲解下处理器PutDatabaseRecord,该处理器的作用是将数据写入数据库。