[数据概念|方案实操]清华数据大讲堂1-海南数据基础设施建设思考与实践

" 全国最大自贸区在数据要素市场改革中都做了什么?"

如鼹鼠哥上一篇文章所介绍,4月17日,在清华公管学院,由杭州数据局局长 徐青山 给大家做了题为《数据要素市场化配置改革杭州实践与思考》的报告,鼹鼠哥自己的一点感受分享在这里

[数据概念|方案实操]数据要素市场化配置改革杭州实践与思考

这个讲座也是一个系列,由清华计算社会科学与国家治理实验室主办。在3月20日,是这个讲座的第一讲,但是鼹鼠哥不巧没能参加,事后找到一些资料给大家分享,所以没有按时间顺序先做这一讲的介绍。

01 报告结构


首先我们看一下报告的结构。两位局长的演讲时间都比较长,都是接近三个小时,不过海南董局长的内容相比杭州徐局长的要更简明一些。

02 题记


董局长的题记简明扼要阐明了海南数据基础设施建设的思路,思路拆分为三点,分别从切入口,重要前提,三方面重要问题或者重要工作。

  1. 数据资源开发利用:这是指在保证数据安全和隐私的前提下,通过技术手段和政策引导,推动公共数据资源的开放、共享和应用。公共数据资源包括政府机构产生的数据、公共服务数据等,这些数据具有很高的价值,但如果无法得到有效开发和利用,就无法发挥其应有的作用。数据资源开发利用的关键在于打破数据孤岛,实现数据的互联互通,让数据在不同部门、不同领域之间流动起来,为经济社会发展提供支撑。

  2. 数据不出域:这是指在数据资源开发利用的过程中,要确保数据在不离开原始产生域的前提下进行加工、分析和应用。也就是说,数据要在源头地进行处理和利用,避免数据跨境、跨区域流动可能带来的安全风险。数据不出域的要求对于保护国家数据安全、公民隐私具有重要意义,同时也是实现数据要素市场化的基本前提。

  3. 数据供得出,流得动,用得好的问题:这是指在数据资源开发利用过程中,要关注数据的输出、流动、应用等环节,确保数据能够高效、安全地服务于各类需求方。具体包括以下几个方面:

  • 数据输出:将公共数据资源以合适的形式、接口和协议提供给需求方,满足其在决策、科研、创新等方面的需求。

  • 数据流动:通过建立数据通道、数据交换平台等技术手段,实现数据在不同系统、不同部门之间的顺畅流动,提高数据的利用效率。

  • 数据应用:鼓励和引导各类主体利用公共数据资源开展应用开发,培育新的经济增长点,推动产业升级。

  • 数据安全:在数据输出、流动和应用过程中,要确保数据的安全性和隐私保护,防止数据泄露、滥用等风险。

03 三方面重点工作


在第三点对重点工作的拆分上,首先是和大家的通常思路是一致的,也都遵循了国家数据局

的总体设计,这一点和杭州的材料表现是一样的。

04 报告要点-数据关联对象


另外,在开场部分,董局长还特别强调了如下几点。

首先,董局长提出了关联对象的概念,并进而阐述了基于数据关联对象,对决定权和数据要素分类工作的思路。

即,数据权益涉及三方面主体,生产主体,关联对象和价值载体。

关联对象也是数据要素和其他要素的最大差异。同时,因为数据要素的特殊性,其所有权意义不大,这一点和其他生产要素也不一样,其有意义的是决定权。

其次,从关联对象也可以较好的对数据进行分类,分为涉公数据(即公共数据),个人数据和法人数据。

以产品化推动价值化

董局长提出的另一个要点就是价值化的路径,他强调了产品化为要点来进行对数据价值化的探索,通过产品化确权和产品资产化来实现产品和资本市场的关联,然后再应用阶段,通过产品价值倒推反向赋予来源数据价值。

05 供得出


下边就是整个报告的核心环节,即围绕数据供得出,流得动,用得好分别阐述海南的经验。

供得出首先要有数据字典,也就是董局长提到的 元数据体系。其实个人觉得这个地方,元数据的概念其实不是很准确。元数据应该是metadata,更多是用来描述数据结构,和这里描述数据的编目的应用场景并不是很合适。

第二是闭环流程,这个流程主要是为了保障数据治理的质量环节。这里鼹鼠哥非常认同董局长在这里专门强调质量闭环,如果没有质量,后边的开发利用根本就无从谈起。

06 流得动


在这个环节,董局长提出了两点措施,即扩大可信域和授权运营。

扩大可信域不是简单的把政务外网和场景纳入到安全区域,而是通过数据清洗脱敏和产品化才对外提供。

其次就是各地通常使用的授权运营方式,这里不再详细阐述。

然后就是打造一个能够对数据实现集成开发利用的服务平台。

以及配套的审核机制。这一点在杭州的经验里也有提到,在授权运营后不能简单就授权了之,这一点海南和杭州所强调的重点是不一样的。

07 用得好


通过授权运营和扩大可信域,现在数据流转起来了,如何发挥更大价值,就看利用环节了。

海南构造了公共数据、超市数据和社会数据三大体系。

这里的超市数据其实和前边的扩大可信域是关联的,也就是本来在可信域内部,不能出域的数据,通过产品化,放在数据超市里就成为了可以开发利用的公共数据产品了。

当然有了数据也离不开基础设施,这也是海南报告的重点

基础设施也是围绕供应,流动和利用三方面建设。

08 场景和配套


海南也相应的重点建设了几个数据利用的场景,包括:

社保核验

电子印章

同时为了支持数据开发利用,也出台了相关的支持政策,包括

数据所有权细则

以及数据资产评估指引

这里鼹鼠哥的看法是,这些法规政策一定会在国数局的安排下尽快形成全国统一的政策,特别是所有权方面。我们要建设的是一个全国性的数据要素大市场,如果没有统一的数据所有权制度,又何谈成为全国性可以流动的生产要素。

09 拓展问题


董局长在第一个拓展问题中就提到了向外发展和全国跨省互信的问题。

这一点和鼹鼠哥的思考正好有了共鸣,未来这个市场一定是全国性的,规则也一定是全国通用,而不是各省各自制定的。

海南还要通过区块链等技术继续扩大可信域,最终触达互联网区域。

在扩大利用场景上,也有一个很好的提法。即,数据类场景中,要从搞项目转变为谋场景,如果没有数据利用的场景,单单做一个数据治理数据开发等等项目,往往结果都是搞完就完,再也没人用,只是偶尔打开大屏给领导看看可视化界面,想必这种结果大家见到的都很多了

10 总结


这个总结。。。没啥可解读的了呵呵。

董局长的演讲内容主要就是这些,鼹鼠哥将继续关注清华大学数据大讲堂系列,感兴趣的朋友还请继续关注。

---------------------------------------------------------------------------************************************************

数据资产化,鼹鼠哥与你一起。

相关推荐
迅易科技43 分钟前
借助腾讯云质检平台的新范式,做工业制造企业质检的“AI慧眼”
人工智能·视觉检测·制造
古希腊掌管学习的神2 小时前
[机器学习]XGBoost(3)——确定树的结构
人工智能·机器学习
ZHOU_WUYI2 小时前
4.metagpt中的软件公司智能体 (ProjectManager 角色)
人工智能·metagpt
靴子学长3 小时前
基于字节大模型的论文翻译(含免费源码)
人工智能·深度学习·nlp
AI_NEW_COME4 小时前
知识库管理系统可扩展性深度测评
人工智能
海棠AI实验室4 小时前
AI的进阶之路:从机器学习到深度学习的演变(一)
人工智能·深度学习·机器学习
hunteritself4 小时前
AI Weekly『12月16-22日』:OpenAI公布o3,谷歌发布首个推理模型,GitHub Copilot免费版上线!
人工智能·gpt·chatgpt·github·openai·copilot
Data跳动4 小时前
Spark内存都消耗在哪里了?
大数据·分布式·spark
IT古董5 小时前
【机器学习】机器学习的基本分类-强化学习-策略梯度(Policy Gradient,PG)
人工智能·机器学习·分类
落魄君子5 小时前
GA-BP分类-遗传算法(Genetic Algorithm)和反向传播算法(Backpropagation)
算法·分类·数据挖掘