安华金和—可信数据空间助力公共数据授权运营安全有序开展的实践探索

伴随数字化、网络化和智能化的快速发展,数字经济与实体经济深度融合,数据已然成为经济发展赖以依托的基础性、战略性资源,对社会生产、分配、流通、消费和社会服务管理等各环节产生深刻影响。我国高度重视数字经济发展,将数据列入继土地、劳动力、资本、技术之后新的重要生产要素,是数字经济发展的核心引擎,而数据流通能够打破数据孤岛,促进数据在不同主体之间的共享和交换,从而更大地释放数据的潜在价值,推动数据从资源化向资产化、价值化的重大变革。

基于公共数据体量大、种类多、覆盖面广、价值潜力大、政府主导型强等特点,作为数据要素的核心组成部分,通过对公共数据的授权运营,可以将这些数据资源转化为有价值的数据资产,对提升公共治理水平和促进产业发展具有重大推动作用;同时,将公共数据运营树立为数据要素市场发展的排头兵,对促进数据要素流通深入发展起着重要的探索和示范作用。

鉴于公共数据的易复制、可传播、非排他性等特性,流通过程中的数据安全风险也日趋突出,导致不敢共享、不愿共享,制约着公共数据的有效流通和价值释放。本文旨在研究和探索公共数据授权运营过程中的安全技术保障体系,解决公共数据运营过程中的数据安全问题,促进公共数据要素流通的健康、有序发展。

国家战略与地方政策背景

2021年,《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》(简称"十四五"规划)中提出,开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用,从顶层政策布局与关注的视角,明确提出了关于公共数据授权运营的战略规划。这一战略是在我国将数据要素确定为新型生产要素并参与分配的背景下提出的,旨在通过盘活公共数据要素资源,释放公共数据的价值,确立了促进公共数据授权运营发展的基本导向。同年,国务院办公厅印发《要素市场化配置综合改革试点总体方案》,提出要探索"原始数据不出域、数据可用不可见"的交易范式,探索开展政府数据授权运营,从安全合规要求与技术实现路径的视角,提出了个人隐私与公共安全保障的原则。

2022年,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(简称"数据二十条")进一步提出推进实施公共数据确权授权机制,明确统筹发展和安全,贯彻总体国家安全观,强化数据安全保障体系建设,把安全贯穿数据供给、流通、使用全过程,划定监管底线和红线。2023年,国家数据局围绕公共数据授权运营,在《"数据要素×"三年行动计划(2024---2026年)》中,提出加大公共数据资源供给,在重点领域、相关区域组织开展公共数据授权运营,探索部省协同的公共数据授权机制,通过提升数据供给水平、优化数据流通环境、加强数据安全保障等措施,推动数据要素与劳动力、资本等要素的协同作用。

在国家数据要素系列政策文件指导和推动下,全国各地多个省市开展了数据流通与交易方面的先行先试、探索实践,如贵州作为全国首个大数据综合试验区,建立了全国最早的贵阳大数据交易所,在全国率先探索数据流通交易价值和交易模式并持续进行数据要素交易流通模式的探索实践;北京出台《北京市数字经济促进条例》,对数据开放共享、数据交易与市场化流通做出规定,针对公共数据流通,提出设立公共数据专区,以建设公共数据开放创新基地等方式,促进数据资源的创新应用;上海出台《上海市数据条例》,对公共数据和个人数据的流转、开放、共享等做出规定,成立了上海大数据交易所,并率先提出数商的概念;广东出台《广东省数据要素市场化配置改革行动方案》,首创数据经纪人作为全省数据要素市场化配置改革的一项制度性安排,旨在鼓励设立社会性数据经纪机构,规范开展数据要素市场流通中介服务;深圳出台《深圳经济特区数据条例》,对个人数据、公共数据、数据要素市场、数据安全等方面做出规定;浙江出台《浙江省公共数据授权运营管理办法(试行)》,提出按照"原始数据不出域、数据可用不可见"的要求,在保护个人信息、商业秘密、保密商务信息和确保公共安全的前提下,向社会提供数据产品和服务"的总体原则,明确数据安全责任与安全管理要求。

公共数据及公共数据授权运营的定义

GB/T 43697-2024《数据安全技术 数据分类分级规则》将公共数据定义为"各级政务部门、具有公共管理和服务职能的组织及其技术支撑单位,在依法履行公共事务管理职责或提供公共服务过程中收集、产生的数据。"

公共数据授权运营,是指"县级以上政府按程序依法授权法人或者非法人组织(以下简称授权运营单位),对授权的公共数据进行加工处理,开发形成数据产品和服务,并向社会提供的行为"。(源自《浙江省公共数据授权运营管理办法(试行)》)

公共数据授权运营参与主体

公共数据授权运营涉及到多个参与主体、多个运营环节的运营生态。其中涉及的参与主体包括:

1)数据资源供给方:数据持有方,保证所提供的数据源合法合规,发布公共数据资源到平台上,供第三方开发利用。

2)数据产品开发方:对公共数据资源进行开发利用,产生数据产品,发布数据产品,与消费者形成数据产品消费合约,也称数商。

3)数据产品消费方:对数据产品进行使用以提升自身的业务或服务能力,愿意为数据产品的使用付费。

4)数据运营方:政府批准授权经营的数据运营第三方,提供公共数据运营平台,供各方发布数据资源,开发、发布和消费数据产品;提供可信数据空间基础设施,供各方开展数据安全协同运算与数据安全流通;对授权运营全过程进行集中管控。

5)运营监管方:根据国家法律法规、行业规范对公共数据授权运营全过程实施监管,在监管方需要时,平台提供接口配合监管方监督、管理、调查。

典型公共数据授权运营流程

基于数据持有权、加工使用权、产品经营权的数据产权分置,围绕公共数据授权运营涉及各参与主体,构建从本地数据资源主题发布,到数据产品开发、产品发布、产品消费与应用,及贯穿全过程的运营与监管流程,并通过供需匹配、运营评价,实现全闭环协同生态圈。

典型的公共数据授权运营业务流程

公共数据授权运营面临风险与安全需求

面向公共授权运营全流程环节,从数据资源供给侧、数据产品开发侧到数据产品消费与使用侧多个角度分析面临的主要数据安全风险:

数据资源供给侧的安全风险

1)数据泄露风险:在数据资源供给过程中,如果安全措施不到位,可能导致公共数据资源被非法获取或泄露。

2)数据篡改风险:在数据资源供给过程中,数据可能被非法篡改或伪造,导致数据失去真实性和可信度。这可能对政府决策、市场分析和公众利益产生负面影响。

3)数据所有权风险:公共数据的所有权属于政府或公众,但在授权运营过程中,如果权责不明确或管理不善,可能导致数据被滥用或侵犯他人权益。

数据产品开发侧的安全风险

1)供应链安全风险:在数据开发过程中,如果供应链中的某个环节存在安全隐患,如数据开发方被恶意攻击或内部人员泄露数据等,都可能对公共数据的安全构成威胁。

2)技术安全风险:在数据开发过程中,如果采用的技术手段存在安全隐患或漏洞,可能导致数据被非法获取或篡改。此外,开发过程中的代码漏洞和配置错误也可能导致安全风险。

3)数据质量风险:如果公共数据存在数据一致性、完整性、关联性等问题,也可能存在因数据质量问题而导致的数据产品计算结果偏离和误导的风险。

数据产品消费与应用的安全风险

1)数据滥用风险:在数据产品消费与应用过程中,如果用户对数据进行不当使用或传播,可能导致数据泄露或侵犯他人隐私;此外,一些不法分子可能利用数据进行非法活动,如诈骗、洗钱等。

2)数据抵赖风险:在数据产品消费过程中,如果没有对数据交易过程进行有效存证,可能导致对交易和结算过程不认可,产生交易纠纷风险。

数据安全需求

打造安全可信的公共数据要素流通环境,有效规避授权运营过程中的数据安全风险,解决公共数据面临的"不敢共享、不愿共享"的问题,确保"数据资源可信发布,数据计算安全流通,数据产品安全使用",支撑保障公共数据"供得出,流得动,用得好"。

公共数据授权运营安全治理的框架思路

设计原则

1)安全与业务融合:

通过对生态角色在各环节的角色分置、流程管控,实现公共数据权属确定、利益分配、安全保护的合理、合规性。

安全性与便利性兼顾:

基于原始数据不出域,可用不可见,合理选择数据样本脱敏、隐私计算、接口安全访问等安全技术在各环节的应用,实现公共数据流通便利性与安全保护的平衡。

3)差异化分级管控:

充分考虑公共数据运营的应用场景需求,该管的管住,该放的放开。根据数据的安全等级要求,以及使用者身份及使用场景不同,落实差异化的防护与监测措施,有效促进数据开发利用。

总体设计思路

面向各授权运营参与主体,围绕授权运营全流程,构建分布式可信数据空间基础设施,基于数据分类分级,建立安全可信通道,实现各方节点的安全可信接入、授权访问、加密传输、安全防护与审计、存证溯源,确保原始数据不出域、分级标签和脱敏样本可出域,数据流通可算、可管、可计量,实现各方节点的域内和跨域流通安全保障。

安全设计思路

*注:可信数据空间是数据要素流通体系的技术保障,通过在现有信息网络上搭建数据集聚、共享、流通和应用的分布式关键基础设施,以体系化的技术安排确保所签订的数据流通协议能够履行和维护,解决数据要素提供方、使用方、服务方、监管方等主体间的安全与信任问题。(源自国内首个可信数据空间标准《可信数据空间系统测试规范》)

总体安全框架

基于IPDR经典安全架构,面向域内数据流转内循环与跨域流通外循环,授权运营总体安全架构覆盖数据识别与分类分级(I)、场景化数据安全防护(P)、全流程数据安全监测(D)、数据安全应急响应处置(R)四个方面:

基于可信数据空间的总体安全框架

1)数据识别与分类分级:包括对数据资源和数据产品两类对象的分类分级及确权授权。

2)场景化数据安全防护:围绕数据资源发布、数据产品开发与发布、数据产品消费与应用环节,从域内流转和跨域流通两个维度,构筑体系化的数据安全防护技术措施。

3)全流程数据安全监测:通过日志存证、全链路流量监测等手段对数据流通全过程操作行为进行全面监测,及时发现违规操作行为并进行预警。

4)数据安全应急响应处置:建立事件分级响应预案,按照事件级别进行及时的应急响应与处置。

安全部署架构示意

整体授权运营可信数据空间的部署架构以分布式形式进行部署,具体划分为:

数据资源安全发布节点:部署在各数据资源提供方的数据资源发布节点,保护数据资源发布过程中安全可信。

数据产品安全开发节点:部署在各数据开发方的数据产品开发节点,保护数据开发过程中可算不可见。

数据安全中心管理节点:部署在授权运营方的授权运营中心控制节点,对跨主体的安全计算进行调度和管理,对整体数据安全进行集中监测与管控。

数据产品消费方访问终端与数据监管方的监管终端:实现对消费方和监管方终端访问的可信接入与安全访问。

部署架构示意

安华金和公共数据授权运营解决方案概述

数据分类分级

对原始静态的数据资源与加工、开发形成的数据产品进行数据识别与分类分级。在实践探索中,公共数据分类按照公共数据业务属性可划分为三类:个人信息、企业信息与社会公共信息;数据分级可按照公开程度划分为三级:无条件开放,受限开放与不予开放;进一步,基于分类分级实现对数据资源使用和数据产品消费的授权确权和安全策略设定,其中授权确权包括基于分类分级的数据样本管理、数据产品开发过程中的数据资源授权使用以及数据产品应用的授权调用。

数据资源与数据产品的分类分级

数据资源提供安全

围绕数据资源提供涉及的域内、跨域各个数据处理活动,为保障数据资源提供过程的安全性,重点需落实如下数据安全技术措施:

数据资源提供过程与数据安全防护措施

数据资源提供节点域内安全防护措施:

1)分类分级处理:依据公开数据分类分级标准,对拟发布的数据资源进行数据分类分级标识,并基于数据分类分级结果,设定数据资源使用的分类分级确权规则。

2)数据加密:基于数据分类分级,对高级别的数据落实数据存储加密处理。

3)数据脱敏:在数据抽取过程中,对采集获取的原始数据视场景和级别进行必要的数据脱敏处理。

4)身份认证与访问控制:针对采集汇聚的数据访问和治理,进行身份认证与细粒度的访问控制。

5)质量检测:对采集汇聚的原始数据集,基于元数据标准,针对其完整性、一致性、关联性进行质量检测,确保数据质量。

6)操作审计:对提供过程的操作行为进行审计,并留存日志。

数据资源提供节点跨域安全防护措施:

1)可信接入:对数据资源提供分布式节点进行可信接入认证,确保节点接入授权运营平台的来源可信。

2)资源访问的确权合约:针对数据开放方对数据资源的访问,基于区块链和智能合约,确保数据资源使用的不可抵赖存证。

3)脱敏样本发布:在主题发布过程中,通过脱敏措施,对发布的高级别样本数据进行必要的脱敏处理。在脱敏处理时,要考虑脱敏规则的一致性,以保障样本脱敏后的可关联性。

4)隐私计算支持:构建分布式数据安全沙箱,支持多方安全计算、横/纵向联邦学习等隐私计算协议,落实原始数据不出域,可算不可见。

5)传输链路加密:对数据提供节点与开发节点、中心节点间的数据传输通道进行链路加密,防止中间人劫持等攻击风险。

6)跨域流通行为审计:对数据资源提供侧的跨域数据流通行为进行审计,以支持全过程数据流转监测与追踪溯源。

数据产品开发安全

围绕数据产品开发涉及的域内、跨域各个数据处理活动,为保障数据产品开发过程的安全性,重点需落实如下数据安全技术措施:

数据产品开发过程与数据安全防护措施

数据产品开发节点域内安全防护措施:

1)样本数据与正式数据保护:针对开发节点自身携带、参与开发的正式数据与从授权运营平台下载的样本数据,基于数据资源分类分级标记,实施相应的身份认证与访问控制、数据加密、数据脱敏、安全审计等通用防护措施。

2)样本数据质量检测:数据样本是落实数据联合开发、建模工作的重要基础,通过对数据样本的完整性、一致性、关联性检测,支撑数据产品开发的准确性、有效性。

3)算法检测:对数据产品开发涉及的算法的安全性、合法合规性进行安全检测,确保算法、模型安全合规,避免数据泄露和不当使用。

4)分类分级处理:依据公开数据分类分级标准,对拟发布的数据产品进行数据分类分级标识,并基于数据分类分级结果,设定数据产品使用的分类分级确权规则。

数据产品开发节点跨域安全防护措施:

1)可信接入:对数据产品开发分布式节点进行可信接入认证,确保节点接入授权运营平台的来源可信。

2)隐私计算支持:构建分布式数据安全沙箱,支持多方安全计算、横/纵向联邦学习等隐私计算协议,落实原始数据不出域,可算不可见。

3)数据脱敏:通过数据脱敏处理措施,对数据产品结果集中涉及的高级别敏感数据进行必要的脱敏处理,避免数据泄露。

4)传输链路加密:对数据开发节点与数据提供节点、中心节点间的数据传输通道进行链路加密,防止中间人劫持等攻击风险。

5)跨域流通行为审计:对数据产品开发侧的跨域数据流通过程进行行为审计,以支持全过程数据流转监测与追踪溯源。

6)产品消费确权合约:针对数据产品消费方对数据产品的访问,基于区块链和智能合约,确保数据产品使用的不可抵赖存证。

数据产品消费安全

数据产品部署上架与产品应用调用,无论是数据集还是预测模型,一般都是以API的形式被调用的,为保障数据产品调用的安全性,重点需落实围绕API的数据安全技术措施:

数据产品消费过程与数据安全防护措施

1)传输链路加密:通过建立HTTPS,VPN专线等手段,确保API调用的通信时通过加密的安全通道进行的。

2)身份认证与访问控制:通过API key等对API调用进行身份认证,并通过黑白名单、分类分级鉴权等措施实现对API调用的访问控制。

3)行为审计:实时监测并记录API的访问行为,识别API调用过程中敏感信息情况。

4)数据水印:在API结果集中嵌入数据水印,以对API中的结果集的数据使用行为进行跟踪溯源。

5)合法正当性检测:在API调用过程中,通过与隐私政策约定的授权处理目的、处理范围进行一致性检测,对存在超范围使用的违规事件及时预警并阻断。

数据安全集中监测与预警

对数据资源发布、数据产品开发及发布、数据产品消费、数据运营保障的全过程行为进行集中监测,发现违规行为及时预警干预,重点需落实如下数据安全技术措施:

1)日志存证:对资源发布行为、产品开发行为、产品消费行为、运营保障管理行为落实全面的日志操作存证。

2)全链路审计:结合操作日志与流量分析,刻画公共数据流通全链路审计视图。

3)监测预警:基于全链路监测,及时发现违规安全事件,并及时预警。

应急响应处置与跟踪溯源

对识别发现的各个级别的数据安全事件进行应急响应处置与事件跟踪溯源。重点需落实如下数据安全技术措施:

1)应急响应处置:制定安全事件应急预案,发生安全事件时立即启动应急预案,实施处置、控制事态、消除隐患、组织研判、保存证据并及时向相关部门报送信息。

2)事件跟踪溯源:对产生的安全事件进行跟踪溯源,分析事件源头与成因。

数据安全合规监管

向公共数据授权运营监管方实时呈现授权运营全过程的数据流通情况与数据安全合规态势,并按监管要求定期输出数据安全合规报告。

公共数据授权运营作为数据要素流通的一种创新模式,目前授权运营模式本身还处于探索阶段,鉴于公共数据授权运营涉及多个利益相关者,如何协调各方利益、确保数据的安全使用必然也是一个需要结合实践应用持续研究和创新的过程。

伴随公共数据授权运营探索的日益深入、法律法规和政策标准的持续健全、创新安全技术和方法的不断涌现和实践,公共数据授权运营安全治理的思路和方法将不断走向体系化、落地化。安华金和坚持技术创新,积极助力公共数据授权运营深入、持续发展,为推动数据要素高效合规有序流通,为数字经济的繁荣贡献力量!

相关推荐
字节跳动数据平台6 小时前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康12 小时前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive
用户962377954481 天前
DVWA 靶场实验报告 (High Level)
安全
数据智能老司机1 天前
用于进攻性网络安全的智能体 AI——在 n8n 中构建你的第一个 AI 工作流
人工智能·安全·agent
数据智能老司机1 天前
用于进攻性网络安全的智能体 AI——智能体 AI 入门
人工智能·安全·agent
用户962377954481 天前
DVWA 靶场实验报告 (Medium Level)
安全
red1giant_star1 天前
S2-067 漏洞复现:Struts2 S2-067 文件上传路径穿越漏洞
安全
字节跳动数据平台1 天前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术1 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
用户962377954481 天前
DVWA Weak Session IDs High 的 Cookie dvwaSession 为什么刷新不出来?
安全