什么是数据资产管理?数据资产管理包括了哪些内容?

数据资产管理包括数据模型管理、数据标准管理、数据质量管理等 10 个活动职能,覆盖数据资源化、数据资产化两个阶段。本章参考 PDCA 方法,从计划、执行、检查、改进四个环节着手,阐述数据资产管理活动职能的核心理念与实践要点。

一、数据模型管理

数据模型是指现实世界数据特征的抽象,用于描述一组数据的概念和定义。数据模型管理是指在企业架构管理和信息系统设计时,参考逻辑模型,使用标准化用语、单词等数据要素设计数据模型,并在企业架构管理、信息系统建设和运行维护过程中,严格按照数据模型管理制度,审核和管理新建和存量的数据模型。

数据模型管理的关键活动包括:

数据模型计划:确认数据模型管理的相关利益方;采集、定义和分析组织级数据模型需求;确定遵循数据模型标准与要求,设计企业级数据模型(包括主题域数据模型、概念数据模型、逻辑数据模型);

数据模型执行:参考逻辑数据模型开发物理数据模型,保留开发过程记录;根据数据模型评审准则与测试结果,由数据模型管理的参与方进行模型评审,评审无异议后发布并上线模型;

数据模型检查:确定数据模型检查标准,定期开展数据模型检查,以确保数据模型与组织级业务架构、数据架构、IT 架构的一致性;保留数据模型检查结果,建立数据模型检查基线;

数据模型改进:根据数据模型检查结果,召集数据模型管理的相关利益方,明确数据模型优化方案;持续改进数据模型设计方法、模型架构、开发技术、管理流程、维护机制等。

采用企业架构指导建立企业级数据模型,并采用一体化建模的方法,是提升数据模型业务指导性和模型质量的有效方式。例如,华为成立了 EAC(企业架构委员会),参考企业架构设计了企业级数据模型(包括主题域数据模型、概念数据模型、逻辑数据模型),较好的描述和展示了业务流程与业务关系,同时,在一定时间内企业级数据模型保持稳定性,有效指导了新业务的方向探索与 IT 建设。

此外,通过引入一体化建模的方法,从技术和机制上支持企业级数据模型与 IT 开发的协同,使物理数据模型与逻辑数据模型保持一致,要求物理数据模型的实体属性来自于数据标准池,并通过元数据对该开发过程进行记录与监控,提升了数据模型的一致性、规范性、可控性。

二、数据标准管理

数据标准是指保障数据的内外部使用和交换的一致性和准确性的规范性约束。数据标准管理的目标是通过制定和发布由数据利益相关方确认的数据标准,结合制度约束、过程管控、技术工具等手段,推动数据的标准化,进一步提升数据质量。

数据标准管理的关键活动包括:

• 数据标准管理计划:确定数据标准管理相关负责人与参与人,开展数据标准需求采集与现状调研,构建组织级数据标准分类框架;制定并发布数据标准管理规划与实施路线;

• 数据标准管理执行:在数据标准分类框架的基础上,定义数据标准;依据数据资产管理认责体系,组织相关人员进行数据标准评审并发布;依托平台工具,应用数据标准(包括数据模型设计与开发、数据质量稽核等);

• 数据标准管理检查:对数据标准的适用性、全面性进行及时检查;依托平台工具,检查并记录数据标准应用程度;

• 数据标准管理改进:通过制定数据标准维护与优化的路线图,遵循数据标准管理工作的组织结构与策略流程,各参与方共同配合进行数据标准维护与管理过程优化。

推动数据标准应用于数据开发、数据质量管理,提升数据标准管理效果。例如,交通银行一方面以新建系统或重构系统为契机,实施数据标准的"强管控",基于数据建模工具打通 IT 开发需求与数据标准,要求IT 人员应用统一建模工具实施开发,推动数据标准有效落地,另一方面以数据标准管理促进数据质量提升,基于数据标准编制数据质量规则,聚焦关键业务领域与关键质量问题,并对数据标准应用情况进行持续监控。

业务术语是统一数据业务含义的关键,业务术语管理是数据标准管理的基础性工作。管理方面,企业已逐步形成统一管理的意识,重点关注业务术语的建设和应用,包括建立管理制度、管理流程并发布业务术语标准,并积极推广业务术语的宣贯和应用,促进业务术语的规范化、便捷化应用。技术方面,通过数据管理平台对业务术语进行统一归集、发布、查询和应用,确保在企业全局形成对核心业务概念的统一定义和使用。以中国工商银行为例,该行通过编制企业级的业务术语标准管理办法明确业务术语的命名规范、相关人员的职责以及应用原则等,建立集团信息标准系统对全行数据标准进行统一管理,定期组织相关培训以确保相关人员对组织内业务术语的理解一致。

三、数据质量管理

数据质量指在特定的业务环境下,数据满足业务运行、管理与决策的程度,是保证数据应用效果的基础。数据质量管理是指运用相关技术来衡量、提高和确保数据质量的规划、实施与控制等一系列活动。衡量数据质量的指标体系包括完整性、规范性、一致性、准确性、唯一性、及时性等。

数据质量管理的关键活动包括:

• 数据质量管理计划:确定数据质量管理相关负责人,明确数据质量的内部需求与外部要求;参考数据标准体系,定义数据质量规则库,构建数据质量评价指标体系;制定数据质量管理策略和管理计划;

• 数据质量管理执行:依托平台工具,管理数据质量内外部要求、规则库、评价指标体系等;确定数据质量管理的业务、项目、数据范畴,开展数据质量稽核和数据质量差异化管理;

•数据质量管理检查 / 分析:记录数据质量稽核结果,分析问题数据产生原因,确定数据质量检查责任人,出具质量评估报告和整改建议;持续测量全流程数据质量,监控数据质量管理操作程序和绩效;确定与评估数据质量服务水平;

• 数据质量管理改进:建立数据质量管理知识库,完善数据质量管理流程,提升数据质量管理效率;确定数据质量服务水平,持续优化数据质量管理策略。

数据质量管理遵循源头治理、闭环管理的原则。源头治理方面,主要是指在新建业务或 IT 系统过程中,明确数据标准或质量规则,采用"一数一源"原则,与数据生产方和数据使用方确认,常见于对于数据时效性要求不高或核心业务增量数据等场景。闭环管理方面,主要是指形成覆盖数据质量需求、问题发现、问题检查、问题整改的良性闭环,对数据采集、流转、加工、使用全流程进行质量校验管控(如图 6 所示),持续根据业务部门数据质量需求优化质量管理方案、调整质量规则库,构建数据质量和管理过程的度量指标体系,不断改进数据质量管理策略。

织信Informat低代码开发平台的客户(某汽车零部件上市企业)以"管理可度量"、"问题可闭环" 以及"质量标签化"三大原则建立质量管理体系。在管理度量方面,着重"以单为锚、量化反映",建设以质量问题单为中心的线上化流程,支持解决时效等关键信息的量化统计,实现审批流转耗时降低 50%;在闭环管理方面,依托数据质量管理系统搭建企业级质量规则库,结合各类数据应用场景的质量需求,已编制质量规则 20000 余条,集中覆盖公司板块、财管领域、EAST5.0 等多个领域,同时针对数据湖历史数据和主题模型层开展常态化监控;在质量标签化方面,推进质量问题单与数据资产目录的联动,将质检信息同步至数据资产界面,方便业务人员基于质量状态标签前置判断数据资产可用性,加快数据资产应用价值释放。

相关推荐
秦jh_3 分钟前
【Linux】多线程(概念,控制)
linux·运维·前端
yaosheng_VALVE24 分钟前
稀硫酸介质中 V 型球阀的材质选择与选型要点-耀圣
运维·spring cloud·自动化·intellij-idea·材质·1024程序员节
SafePloy安策1 小时前
ES信息防泄漏:策略与实践
大数据·elasticsearch·开源
学术搬运工1 小时前
【珠海科技学院主办,暨南大学协办 | IEEE出版 | EI检索稳定 】2024年健康大数据与智能医疗国际会议(ICHIH 2024)
大数据·图像处理·人工智能·科技·机器学习·自然语言处理
看山还是山,看水还是。1 小时前
Redis 配置
运维·数据库·redis·安全·缓存·测试覆盖率
扣得君1 小时前
C++20 Coroutine Echo Server
运维·服务器·c++20
keep__go1 小时前
Linux 批量配置互信
linux·运维·服务器·数据库·shell
矛取矛求2 小时前
Linux中给普通账户一次性提权
linux·运维·服务器
Matrix702 小时前
HBase理论_背景特点及数据单元及与Hive对比
大数据·数据库·hbase
death bell3 小时前
Docker基础概念
运维·docker·容器