ETL 和 ELT区别-2

T-ETL和ELT区别_tetl-CSDN博客

ETL(提取、转换和加载)和 ELT(提取、加载和转换)是企业用来从多个源提取数据并将其组合到单个数据库或数据仓库中进行分析的过程。这两种方法都使用以下步骤(但顺序不同)来准备数据以进行分析:

  • 提取:此步骤涉及从源中提取数据,源可以是 MySQL 或 MongoDB 等数据库,也可以是 Google 表格、Google Drive 或 Salesforce 等任何其他应用程序。

  • 加载:在此步骤中,数据将加载到分析工作负载的目标仓库或数据库。

  • 转换:此步骤可用于清理、处理数据并将其转换为适合加载到目标和进一步分析的格式。

ETL ELT
数据转型 原始数据在加载到目标之前进行转换。 原始数据在加载到目标后进行转换。
加载时间 ETL 需要更多时间将数据加载到目标,因为数据首先被转换。 ELT 速度更快,因为数据直接加载到目标。
数据量 更适合需要非常复杂转换的小型数据集。 非常适合更强调获取实时数据进行分析的大型数据集。

一些新的词汇

in-flight-transformations

提取或加载过程中自动转换源数据

Schema Mapper

结构映射器:

hevodata 的 event 和 event-type

从源中获取数据称为 Hevo 中的事件摄取,而将摄取的数据复制到目标中称为事件的加载。每个 Hevo 计划每月提供固定数量的活动。读取事件用法

如何管理过程中的事件Managing Objects in Pipelines - Hevo Data

Schema Mapper Actions

  • 跳过了一行数据
  • 重置了数仓结构
  • 发现没有绑定的字段
相关推荐
RestCloud18 小时前
TiDB 混合负载场景下的 ETL 与 CDC 实践
数据仓库·tidb·etl·cdc·数据同步·数据库传输
AllData公司负责人2 天前
AllData数据中台通过开源项目RustFS建设现代数据湖存储,接入工业, 医疗, 物联网数据,包括文件/图像/音频/视频数据!
数据库·数据仓库·物联网·开源·数据存储·数据接入·rustfs
RestCloud2 天前
2026年数据集成三大趋势:从批处理到实时事件驱动
ai·etl·cdc·数据传输·数据同步·数据集成平台·集成平台
juniperhan2 天前
Flink 系列第14篇:Flink Metrics 监控指标详解(生产环境版)
大数据·数据仓库·分布式·flink
菜鸟小码2 天前
深入理解 Hive 数据模型
数据仓库·hive·hadoop
菜鸟小码2 天前
Hive环境搭建与配置优化
数据仓库·hive·hadoop
xiaogai_gai3 天前
金蝶云星空API接口的ETL转换与数据写入方案
数据仓库·etl
菜鸟小码3 天前
Hive数据类型全解析:从基础到复杂类型实战指南
数据仓库·hive·hadoop
Gauss松鼠会3 天前
【GaussDB】浅谈SQL与ETL
数据库·数据仓库·sql·etl·gaussdb·经验总结
juniperhan3 天前
Flink 系列第13篇:Flink 生产环境中的并行度与资源配置
java·大数据·数据仓库·分布式·flink