技术栈
元数据
RestCloud
6 天前
数据仓库
·
etl
·
数据处理
·
数据传输
·
元数据
·
数据集成平台
·
dataops
让数据流动更智能:元数据如何重塑DataOps与ETL
近几年,随着企业数据资产规模的指数级增长,传统的ETL和数据集成方式已经难以应对多源、异构、实时和高频变化的数据场景。 Gartner 在其最新的《Data Integration Strategies》和《Market Guide to DataOps》报告中提出了一个重要趋势:“未来的数据管理将以元数据为中心,从静态记录走向主动驱动(Metadata Activation)。”
北邮-吴怀玉
8 天前
大数据
·
数据治理
·
元数据
5.2 大数据方法论与实践指南-存储元数据治理
5.2 元数据5.2.1 工具数仓开源元数据项目对比(Apache Atlas、Apache Gravitino、DataHub、OpenMetadata、Amundsen、Metacat、Marquez)
XueminXu
2 个月前
sql
·
spark
·
spark-sql
·
sql文件
·
元数据
·
sql脚本
·
hms
Spark-SQL任务提交方式
Spark-SQL在一定程度上可以代替Hive,但一般依赖Hive的元数据,即Metastore。Spark-SQL的交互式模式可以运行bin/spark-sql进入,按照类似hive方式写SQL代码。
妙BOOK言
3 个月前
论文阅读
·
元数据
·
分布式文件系统
FalconFS: Distributed File System for Large-Scale Deep Learning Pipeline——论文阅读
NSDI 2026 Paper 分布式元数据论文阅读笔记整理分布式文件系统(DFS)是现代数据中心的重要组成部分。通过在统一的分层目录结构中提供符合POSIX标准的文件接口,DFS实现了对底层存储资源的通用访问,从而简化了存储管理,促进了不同应用程序之间的数据共享[2,35]。
isNotNullX
5 个月前
大数据
·
数据仓库
·
数据治理
·
etl
·
元数据
一文辨析:数据仓库、数据湖、湖仓一体
目录一、数据仓库1.结构化数据为主2.OLAP 优化3.强一致性保障4.SQL 优先接口二、数据湖1. SchemaonRead结构
isNotNullX
5 个月前
大数据
·
数据库
·
数据仓库
·
数据治理
·
元数据
什么是数据清洗?数据清洗有哪些步骤?
目录一、数据清洗的定义和重要性1. 数据清洗的定义2. 数据清洗的重要性二、数据清洗的前期准备1. 明确清洗目标
程序员一一涤生
5 个月前
知识库
·
标签
·
元数据
·
rag
RAG越来越不准?一文详解元数据与标签的系统优化方法(附完整流程图+实用提示词)
你是不是也遇到过这样的场景?其实,你不是一个人。90%的RAG系统体验不理想,核心问题并不在于大模型“笨”,而是元数据、标签、知识目录这“三板斧”没有用对!
程序员一一涤生
6 个月前
知识库
·
元数据
·
rag
RAG越来越不准?你可能忽略了“元数据”的力量
结果它却信誓旦旦地告诉了你B软件的安装步骤。在这个过程中,你可能已经花了大量时间解析和清洗上千份文档,接入RAG,但结果仍然不理想。
镜舟科技
7 个月前
starrocks
·
数据分析
·
apache
·
iceberg
·
数据湖
·
湖仓一体
·
元数据
Apache Iceberg 解析,一文了解Iceberg定义、应用及未来发展
Apache Iceberg 是一种开源的 表格式(Table Format) ,专为超大规模数据分析场景设计,通过标准化数据存储规范与访问协议,解决了传统数据湖在元数据管理、事务控制、查询性能等方面的核心痛点。以下从六个维度全面解析其技术原理、应用场景与最佳实践。
Leo.yuan
1 年前
数据中台
·
元数据
·
数据血缘
35页PDF | 元数据与数据血缘落地实施(限免下载)
这份报告详细介绍了元数据与数据血缘的概念、重要性以及在企业数据中台中的应用。报告阐述了数据中台的核心价值在于整合和管理体系内的数据,以提升数据资产化能力并支持业务决策。报告还涵盖了元数据的分类(技术元数据和业务元数据)、数据血缘的构成要素(流转路径、实体节点和节点属性),并通过流程图和框架图展示了元数据与数据血缘的落地实施过程。此外,报告还探讨了元数据采集的方法、血缘解析的技术手段,以及如何通过图数据库高效存储和查询血缘关系。最后,报告强调了元数据与数据血缘在业务中的价值,如数据资产管理、数据地图构建、血
平凡之大路
1 年前
dama
·
元数据
【数据管理】DAMA-元数据专题
导读:元数据是关于数据的组织、数据域及其关系的信息,是描述数据的数据。在数据治理中,元数据扮演着至关重要的角色,是数据治理的基础和支撑。以下是对数据治理中元数据专题方案的详细介绍:
Android技术栈
1 年前
c语言
·
c++
·
音视频
·
harmonyos
·
媒体
·
openharmony
·
元数据
鸿蒙(API 12 Beta3版)【元数据(C/C++)】媒体相机开发指导
元数据(Metadata)是对相机返回的图像信息数据的描述和上下文,针对图像信息,提供的更详细的数据,如照片或视频中,识别人像的取景框坐标等信息。
张永清
1 年前
数据资产管理
·
元数据
·
数据血缘
《数据资产管理核心技术与应用》读书笔记-第三章:数据血缘
《数据资产管理核心技术与应用》是清华大学出版社出版的一本图书,全书共分10章,第1章主要让读者认识数据资产,了解数据资产相关的基础概念,以及数据资产的发展情况。第2~8章主要介绍大数据时代数据资产管理所涉及的核心技术,内容包括元数据的采集与存储、数据血缘、数据质量、数据监控与告警、数据服务、数据权限与安全、数据资产管理架构等。第9~10章主要从实战的角度介绍数据资产管理技术的应用实践,包括如何对元数据进行管理以发挥出数据资产的更大潜力,以及如何对数据进行建模以挖掘出数据中更大的价值。
Amd794
1 年前
用户体验
·
元数据
·
错误处理
·
自定义错误
·
vue组件
·
api路由
·
nuxt应用
使用 createError 创建错误对象的详细指南
title: 使用 createError 创建错误对象的详细指南 date: 2024/8/8 updated: 2024/8/8 author: cmdragon
鲁鲁517
1 年前
元数据
·
梧桐数据库
梧桐数据库(WuTongDB):数据库中元数据表的常见信息
元数据表是数据库系统中用于存储和管理元数据的表。这些表提供关于数据库对象(如表、列、索引、视图、存储过程等)的详细信息。以下是元数据表的一些常见类型及其详细解释:
张永清
1 年前
数据资产管理
·
元数据
《数据资产管理核心技术与应用》读书笔记-第二章:元数据的采集与存储
《数据资产管理核心技术与应用》是清华大学出版社出版的一本图书,全书共分10章,第1章主要让读者认识数据资产,了解数据资产相关的基础概念,以及数据资产的发展情况。第2~8章主要介绍大数据时代数据资产管理所涉及的核心技术,内容包括元数据的采集与存储、数据血缘、数据质量、数据监控与告警、数据服务、数据权限与安全、数据资产管理架构等。第9~10章主要从实战的角度介绍数据资产管理技术的应用实践,包括如何对元数据进行管理以发挥出数据资产的更大潜力,以及如何对数据进行建模以挖掘出数据中更大的价值。
张永清
1 年前
数据资产管理
·
元数据
《数据资产管理核心技术与应用》读书笔记-第一章:认识数据资产
《数据资产管理核心技术与应用》是清华大学出版社出版的一本图书,全书共分10章,第1章主要让读者认识数据资产,了解数据资产相关的基础概念,以及数据资产的发展情况。第2~8章主要介绍大数据时代数据资产管理所涉及的核心技术,内容包括元数据的采集与存储、数据血缘、数据质量、数据监控与告警、数据服务、数据权限与安全、数据资产管理架构等。第9~10章主要从实战的角度介绍数据资产管理技术的应用实践,包括如何对元数据进行管理以发挥出数据资产的更大潜力,以及如何对数据进行建模以挖掘出数据中更大的价值。
张永清
1 年前
大数据
·
数据资产管理
·
元数据
·
数据血缘
图书《数据资产管理核心技术与应用》分享
《数据资产管理核心技术与应用》是由清华大学出版社出版的一本图书,该图书主要特点如下:1、依托于大数据技术,独家解密数据血缘的底层技术实现
华为云开发者联盟
1 年前
mysql
·
缓存
·
数据字典
·
元数据
·
华为云开发者联盟
解读MySQL 8.0数据字典缓存管理机制
MySQL的数据字典(Data Dictionary,简称DD),用于存储数据库的元数据信息,它在8.0版本中被重新设计和实现,通过将所有DD数据唯一地持久化到InnoDB存储引擎的DD tables,实现了DD的统一管理。为了避免每次访问DD都去存储中读取数据,使DD内存对象能够复用,DD实现了两级缓存的架构,这样在每个线程使用DD client访问DD时可以通过两级缓存来加速对DD的内存访问。
妙BOOK言
2 年前
论文阅读
·
元数据
·
分布式文件系统
Finding a needle in Haystack: Facebook’s photo storage——论文泛读
OSDI 2010 Paper 分布式元数据论文阅读笔记整理到2010年为止,用户已经在Facebook上传了超过650亿张照片,对于每个上传的照片,Facebook生成并存储四个不同大小的图像,导致目前存储了超过2600亿张图片,相当于超过20PB的数据。用户每周上传10亿张新照片(~60TB),Facebook在峰值时每秒提供超过100万张图片。庞大的数据量为图片存储提出了新的挑战。