数据血缘

张永清1 个月前
数据资产管理·元数据·数据血缘
《数据资产管理核心技术与应用》读书笔记-第三章:数据血缘《数据资产管理核心技术与应用》是清华大学出版社出版的一本图书,全书共分10章,第1章主要让读者认识数据资产,了解数据资产相关的基础概念,以及数据资产的发展情况。第2~8章主要介绍大数据时代数据资产管理所涉及的核心技术,内容包括元数据的采集与存储、数据血缘、数据质量、数据监控与告警、数据服务、数据权限与安全、数据资产管理架构等。第9~10章主要从实战的角度介绍数据资产管理技术的应用实践,包括如何对元数据进行管理以发挥出数据资产的更大潜力,以及如何对数据进行建模以挖掘出数据中更大的价值。
张永清2 个月前
大数据·数据资产管理·数据血缘
图书《数据资产管理核心技术与应用》核心章节节选-3.1.2. 从Spark 执行计划中获取数据血缘本文节选自清华大学出版社出版的图书《数据资产管理核心技术与应用》,作者为张永清等著。从Spark 执行计划中获取数据血缘
张永清2 个月前
大数据·数据资产管理·元数据·数据血缘
图书《数据资产管理核心技术与应用》分享《数据资产管理核心技术与应用》是由清华大学出版社出版的一本图书,该图书主要特点如下:1、依托于大数据技术,独家解密数据血缘的底层技术实现
zhangjin12222 个月前
数据仓库·etl·etl工具·kettle教程·kettle血缘·数据血缘
kettle从入门到精通 第七五课 ETL之kettle血缘,数据血缘在了解kettle血缘之前,咱们先来了解下什么是数据血缘?1、数据血缘定义(来自gpt)数据血缘(Data Lineage)是指在数据管理和数据分析中追踪数据的源头、流向和处理过程的能力。具体来说,数据血缘描述了数据如何被创建、变换和移动,以及这些过程中数据的路径和影响。它有助于理解数据的可靠性、完整性和可信度,是数据治理和合规性的重要组成部分。