数据治理

Light604 天前
数据治理·ipaas·apaas·权限一体化·接口契约·能力包
《中国电力产业数字化》深度解析与前沿展望(下)——中国电力数字化转型路线图:SPARK 融合平台的设计与落地方案导读:本文承接上篇,从《中国电力产业数字化》的战略蓝图出发,结合 SPARK 融合平台的工程化实践,提出一条“三步走”的转型路线图。全文以行业痛点为线索、以平台能力为抓手、以价值量化为凭证,并配套流程图与架构图,力求为央国企与大型电力企业提供可审计、可落地、可复用的参考路径。本文首发并置顶于作者 CSDN 博客专栏,欢迎行业同仁交流与补充案例。
胡耀超4 天前
安全·数据治理·数据安全·权限管理·安全架构·hadoop生态·合规审计
大数据平台安全指南——大数据平台安全架构全景:从认证授权到数据治理的企业级实践指南——认证、授权、审计、加密四大支柱认证、授权、审计、加密四大支柱传统安全 vs 大数据安全:传统IT系统的特点:大数据平台的特点:核心挑战:
fanstuck5 天前
数据库·sql·重构·数据挖掘·数据治理
开源项目重构我们应该怎么做-以 SQL 血缘系统开源项目为例在技术人的世界里,“写代码”是起点,但“重构代码”才是成长的开始。 写一个能跑起来的项目并不难,尤其在开源社区里,快速验证想法、实现功能是最常见的节奏。但当项目逐渐成型、功能越来越多、用户越来越多时,你会突然发现:它开始变慢了、变乱了、变得难以维护。那一刻,重构的信号就响了。这次我选择重构的,是一个我自己曾经开源出去的项目——SQL 血缘解析系统。 这个系统的核心目标其实很简单:从 SQL 语句中提取表、字段之间的依赖关系,并以可视化的方式呈现出“数据的流向”。
Jolie_Liang6 天前
数据治理
金融领域数据治理与隐私保护研究报告在数字经济蓬勃发展的时代背景下,金融数据已成为推动金融业创新发展的核心生产要素。随着人工智能、大数据、区块链等技术在金融领域的广泛应用,金融数据的规模呈指数级增长,数据类型日益丰富,数据价值不断凸显。然而,与此同时,金融数据的安全风险也在不断累积,数据泄露、隐私侵犯、跨境流动监管等问题日益突出,对金融稳定和消费者权益保护构成严峻挑战。
数据要素X10 天前
大数据·运维·数据仓库·微服务·数据治理·数据中台·可信数据空间
寻梦数据空间 | 架构篇:从概念到落地的技术实践与突破性创新[ 架构篇 ]—从概念到落地的技术实践与突破性创新—在数字经济时代,数据要素的可信流通与高效利用已成为企业数字化转型、国家数字基础设施建设的核心命题。数据空间作为破解“数据孤岛”、保障数据安全、释放数据价值的新型互联范式,其技术架构是将“可信流通”蓝图变为现实的关键载体。
数据要素X17 天前
大数据·数据仓库·数据治理·数据中台
【大数据实战】如何从0到1构建用户画像系统(案例+数据仓库+Airflow调度)构建用户画像系统是一个涵盖数据架构、工程实现和业务应用的完整体系。其开发流程包含七个关键阶段:从目标解读、任务分解与需求调研,到需求场景明确、数据口径确认,再到特征选取与模型落表、线下验收测试,最终完成线上发布与效果追踪。
王百万_1 个月前
大数据·数据库·分布式·flink·spark·数据治理·数据库架构
【浅谈Spark和Flink区别及应用】Flink 和 Spark 是当前主流的大数据计算框架,核心差异在于 Flink 是基于流的实时计算框架,而 Spark 是基于批的离线计算框架(后通过 Spark Streaming 补充流处理能力)。 1. 核心计算模型(根本差异) Flink:流优先(Stream-First) 视所有数据为“无界流”,离线数据是“有界流”的特例,从底层设计上原生支持流处理,计算更实时、状态管理更精准。 Spark:批优先(Batch-First) 基于“弹性分布式数据集(RDD)”的批处理模型,流处理(Spark
千桐科技1 个月前
数据治理·大数据平台·qdata·开源数据中台·千数平台·java数据中台·qdata数据中台
轻松上手 qData 数据中台开源版:Docker Compose 助你10分钟跑起来谁适合看这份指南?我们已经为你准备好“开箱即用”的完整部署包,包括:不需要手动安装一堆依赖、不用构建前端、不用复杂配置。只需解压并运行脚本,整个大数据平台和 qData 就能跑起来! 零基础也能轻松搞定!10分钟体验 qData!
袋鼠云数栈2 个月前
经验分享·数据治理·数字孪生·空间智能·数据智能·产品升级·数字孪生产品
袋鼠云产品功能更新报告14期|实时开发,效率再升级!本期,我们更新和优化了实时开发相关功能,为您提供更高效的产品能力。以下为第14期袋鼠云产品功能更新报告,请继续阅读。
友莘居士2 个月前
apache·数据治理·dolphin·数据质量·scheduler·数据质检
Apache DolphinScheduler:数据治理中数据质检利器Apache DolphinScheduler 是一个分布式、易扩展的可视化 DAG(有向无环图)工作流任务调度平台。它的核心目标是解决复杂任务依赖关系下的调度问题,让数据工程师和数据分析师能够轻松地构建、管理和监控数据流水线。
向上的车轮2 个月前
spring boot·数据治理·orm
Spring Boot生态中ORM对数据治理的支持有哪些?在 Spring Boot 生态中,ORM(对象关系映射)框架的选择丰富多样,主要分为 JPA 规范实现、半自动化 ORM、代码生成型 ORM 及 扩展工具 等类型。以下是主流 ORM 框架的详细介绍,包括其特点、适用场景及与 Spring Boot 的集成方式:
船长@Quant2 个月前
hadoop·数据治理·元数据管理·数据血缘·gdpr合规·apache atlas
元数据管理与数据治理平台:Apache Atlas 基本搜索 Basic Search文中内容仅限技术学习与代码实践参考,市场存在不确定性,技术分析需谨慎验证,不构成任何投资建议。Apache Atlas 框架是一套可扩展的核心基础治理服务,使企业能够有效、高效地满足 Hadoop 中的合规性要求,并支持与整个企业数据生态系统集成。这将通过使用规范和取证模型,以及技术和运营审计以及由业务分类元数据丰富的沿袭,在 Hadoop 中提供真正的可视性。它还使任何元数据使用者能够互操作,而无需彼此独立的接口——元数据存储是通用的。通过利用 Apache Ranger 来维护元数据的准确性,以防止在
喻师傅3 个月前
大数据·数据仓库·数据治理
数据治理:DQC(Data Quality Center,数据质量中心)概述关键词:DQC、数据质量、数据治理、数据监控、数据可靠性在数据驱动决策的时代,数据质量已成为企业竞争力的核心要素之一。我们常说“垃圾进,垃圾出”(Garbage In, Garbage Out),如果数据本身存在缺失、重复、错误或延迟,那么基于这些数据做出的分析、报表、推荐系统甚至自动化决策都将失去可信度。
Altair澳汰尔3 个月前
人工智能·ai·汽车·数据治理·仿真·cae·physicsai
行业热点丨仿真历史数据难以使用?如何利用几何深度学习破局,加速汽车工程创新01、AI 驱动研发升级:几何深度学习创造行业新价值人工智能正加速推动各行业研发能力升级。麦肯锡最新报告显示,该技术在制药、化工和航空航天等领域的应用,有望为相关企业创造高达5600亿美元的经济价值。 AI 技术应用的先行者,全球500强汽车零部件制造商麦格纳(Magna)。通过与 Altair 合作,运用几何深度学习(Geometric Deep Learning, GDL)技术,显著提升了汽车工程创新效率。
天翼云开发者社区3 个月前
数据治理
数据治理之数据质量评估维度及方法本文分享自天翼云开发者社区《数据治理之数据质量评估维度及方法》,作者:i****n从某种程度上来说“数据=金钱”,数据质量的好坏直接决定着数据价值高低,直接或简介影响一个企业的决策方向。数据质量管理是指在数据创建、加工、使用和迁移等过程中,通过开展数据质量定义、过程控制、监测、问题分析和整改、评估与考核等一系列管理活动,提高数据质量以满足业务要求。
计算所陈老师3 个月前
人工智能·个人开发·数据治理
SmartETL循环流程的设计与应用**检索增强生成(RAG)**是指通过检索对大模型生成进行增强的技术,通过充分利用信息检索(尤其是语义检索)相关技术,实现大模型快速扩展最新知识、有效减少幻觉的能力。主流RAG框架包括问题理解、知识检索、知识选择/重排、答案生成等几个过程,并且通常来说这几个步骤是顺序执行的(pipeline),如下图(图片引用自https://medium.com/@mayssamayel4/building-a-rag-system-with-gpt-4-a-step-by-step-guide-291711342f0
袋鼠云数栈3 个月前
大数据·运维·数据库·后端·mysql·ai·数据治理·数栈·data+ai
使用自然语言体验对话式MySQL数据库运维现代大型语言模型(LLM)本质上是一个经过深度训练的智能知识库,其显著特征包括:通过专用工具链的增强,我们能够实现:
isNotNullX4 个月前
大数据·数据库·数据仓库·oracle·数据治理
据字典是什么?和数据库、数据仓库有什么关系?目录一、数据字典的定义及作用1. 对于数据开发者2. 对于业务人员3. 对于数据管理员二、数据字典的组成
isNotNullX4 个月前
大数据·数据仓库·数据治理·etl·元数据
一文辨析:数据仓库、数据湖、湖仓一体目录一、数据仓库1.结构化数据为主2.OLAP 优化3.强一致性保障4.SQL 优先接口二、数据湖1. SchemaonRead结构
isNotNullX4 个月前
大数据·数据库·数据仓库·数据治理·元数据
什么是数据清洗?数据清洗有哪些步骤?目录一、数据清洗的定义和重要性1. 数据清洗的定义2. 数据清洗的重要性二、数据清洗的前期准备1. 明确清洗目标