可信数据空间设计思路
与物联网数据中台解决"企业内部数据孤岛"不同,可信数据空间的核心使命是解决跨主体、跨行业、跨地域的数据流通信任问题,让数据在"可用不可见、可控可追溯"的前提下实现价值共创。
如果说数据中台是企业的"数据仓库",那么可信数据空间就是多个主体之间的"数据交易市场+高速公路+交通规则"三位一体的基础设施。
一、核心概念与定位
1.1 官方定义
根据国家数据局发布的《可信数据空间发展行动计划(2024---2028年)》,可信数据空间是:
"基于共识规则,联接多方主体,实现数据资源共享共用的一种数据流通利用基础设施,是数据要素价值共创的应用生态,是支撑构建全国一体化数据市场的重要载体。"
1.2 与数据中台的关键区别
| 维度 | 数据中台 | 可信数据空间 |
|---|---|---|
| 核心目标 | 企业内部数据整合与复用 | 跨主体数据可信流通 |
| 信任基础 | 企业内部信任(管理约束) | 技术+规则双重信任(算法约束) |
| 数据主权 | 数据归企业所有 | 数据提供方保留控制权 |
| 核心能力 | 存储、计算、分析 | 管控、交互、共创 |
| 典型场景 | BI报表、用户画像、精准营销 | 供应链协同、联合风控、跨境科研 |
形象理解:如果说数据中台是企业的"内部图书馆",那么可信数据空间就是多个机构共建的"数据合作区"------各方可以带自己的数据进来,在遵守规则的前提下共同使用,但谁也不能把别人的数据带走。
二、整体架构设计
┌─────────────────────────────────────────────────────────────────┐
│ 应用生态层 │
│ 供应链协同 │ 联合风控 │ 跨境科研 │ 公共数据运营 │ 行业大模型 │
└─────────────────────────────────────────────────────────────────┘
↑
┌─────────────────────────────────────────────────────────────────┐
│ 价值共创层 │
│ 数据产品交易 │ 联合分析 │ 联邦学习 │ 收益分配 │ 生态治理 │
└─────────────────────────────────────────────────────────────────┘
↑
┌─────────────────────────────────────────────────────────────────┐
│ 资源交互层 │
│ 数据目录 │ 语义发现 │ 元数据管理 │ 协议转换 │ 跨空间互联 │
└─────────────────────────────────────────────────────────────────┘
↑
┌─────────────────────────────────────────────────────────────────┐
│ 可信管控层(核心) │
│ 身份管理 │ 使用控制 │ 数字合约 │ 存证审计 │ 隐私计算 │ 区块链 │
└─────────────────────────────────────────────────────────────────┘
↑
┌─────────────────────────────────────────────────────────────────┐
│ 技术底座层 │
│ 连接器 │ 服务平台 │ 加密存储 │ 计算集群 │ 分布式网络 │
└─────────────────────────────────────────────────────────────────┘
2.1 核心架构原则
根据全国数标委发布的《可信数据空间 技术架构》(2025年4月实施),可信数据空间由两大核心组件构成:
(1)可信数据空间服务平台
- 空间运营方的"管理中心"
- 功能:身份管理、连接器管理、目录管理、数字合约管理、存证审计
- 部署方式:中心化运营,但数据不经过平台
(2)可信数据空间连接器
- 各参与方的"接入网关"
- 功能:数据交付、使用控制、策略执行、本地存证
- 部署方式:分布式部署,数据提供方自行掌控
关键设计:服务平台只"撮合"不"经手"数据,数据流在连接器之间点对点传输,从根本上避免平台方窃取数据的风险。
三、三大核心能力设计
3.1 可信管控能力------让数据"敢流通"
这是可信数据空间的核心差异化能力,解决数据提供方"不敢共享"的问题。
(1)身份可信
设计要点:
- 采用DID(去中心化身份)为每个参与主体分配唯一可信身份
- 身份信息上链存证,不可篡改
- 支持与现有CA体系对接
实现方式:
yaml
身份认证流程:
注册: 主体提交资质证明 → 平台审核 → 颁发DID → 上链存证
认证: 连接器出示DID → 验证智能合约 → 确认身份有效性
溯源: 所有操作关联DID → 全链路可追溯
(2)数据可信
设计要点:
- 数据来源合法性审查
- 数据质量评估与分级
- 数据内容真实性验证(可选哈希上链)
(3)过程可信------使用控制为核心
这是可信数据空间最具创新性的技术设计,实现数据的"可用不可见、可控可追溯"。
使用控制模型:
数据提供方制定使用策略 → 编码为数字合约 → 部署到区块链
↓
数据使用方申请使用 → 触发智能合约校验 → 连接器执行策略
↓
┌─────────┴─────────┐
↓ ↓
允许使用 拒绝访问
↓
在沙箱/TEE中计算
↓
仅输出结果,不留存原始数据
↓
使用行为上链存证
策略示例:
json
{
"数据产品": "供应链销售数据",
"使用策略": {
"允许主体": ["认证供应商A", "认证供应商B"],
"允许目的": ["库存预测", "需求分析"],
"禁止行为": ["转售", "导出原始数据", "关联外部数据重标识"],
"使用限制": {"次数": 1000, "有效期": "2026-12-31"},
"计算环境": "TEE可信执行环境,结果脱敏输出"
}
}
关键技术组合:
| 技术 | 作用 | 适用场景 |
|---|---|---|
| 使用控制 | 精细化策略执行 | 所有流通场景必备 |
| 隐私计算(多方安全计算/联邦学习) | 多方数据联合计算不泄露原始数据 | 联合风控、科研分析 |
| 可信执行环境(TEE) | 硬件级隔离计算 | 高敏感数据处理 |
| 数据沙箱 | 受控环境下分析 | 公共数据开放 |
| 区块链 | 存证、审计、智能合约 | 全流程可追溯 |
3.2 资源交互能力------让数据"找得到"
解决数据使用方"找不到数据、不知道数据质量"的问题。
设计要点:
(1)统一数据目录
- 数据产品发布、检索、发现机制
- 支持语义搜索和元数据智能识别
- 数据样例预览(不暴露敏感信息)
(2)标准化接口
- 连接器与服务平台的标准化交互协议
- 跨空间互联互通的技术基础
(3)数据标识体系
- 为数据产品分配唯一标识
- 支持跨空间数据发现和引用
3.3 价值共创能力------让数据"用得好"
解决"有数据没场景、有场景没数据"的问题,形成可持续的生态。
设计要点:
(1)数据产品化
- 原始数据 → 数据产品(加工、脱敏、封装)
- 产品上架 → 目录发布 → 定价
(2)交易与结算
- 数字合约自动执行
- 使用情况计量(调用次数、计算量)
- 收益自动分配(智能合约)
(3)生态治理
- 参与方评价体系
- 争议仲裁机制
- 合规性持续监控
四、五类可信数据空间
根据《行动计划》,可信数据空间分为五类:
| 类型 | 核心定位 | 典型场景 |
|---|---|---|
| 企业数据空间 | 龙头企业带动供应链数据协同 | 长虹工业数据空间:代工厂共享质检数据,节约成本20%+ |
| 行业数据空间 | 解决行业共性数据流通难题 | Catena-X汽车数据空间:宝马/奔驰/西门子共建,接入1000+企业 |
| 城市数据空间 | 公共数据授权运营与产城融合 | 上海城市数据空间:300家企业、4亿次调用、千亿放款 |
| 个人数据空间 | 个人数据主权控制 | 个人健康数据授权医疗机构使用 |
| 跨境数据空间 | 跨境数据合规流动 | 粤港澳大湾区科研科创跨境数据空间 |
五、关键业务流程
5.1 数据流通全生命周期
步骤1: 空间建立
运营方部署服务平台 → 制定空间规则 → 邀请参与方注册
步骤2: 资源发布
提供方部署连接器 → 数据产品化 → 发布到数据目录 → 上链存证
步骤3: 发现与签约
使用方检索目录 → 发起申请 → 协商数字合约 → 多方签署 → 合约上链
步骤4: 数据交付
使用方连接器发起请求 → 提供方连接器校验合约 → 执行策略 → 交付数据
(数据流点对点,不经服务平台)
步骤5: 使用与审计
使用方在受控环境计算 → 使用行为上报 → 服务平台存证 → 合规审计
步骤6: 清算与结束
计量使用情况 → 触发收益分配 → 合约到期自动终止权限
5.2 关键技术接口
yaml
服务平台-连接器接口:
身份认证接口: 注册、认证、更新DID
目录接口: 发布、查询、下架数据产品
合约接口: 协商、签署、查询合约状态
存证接口: 上报使用日志、查询审计记录
连接器-连接器接口:
握手协议: 双向认证、策略协商
数据传输: 加密传输、断点续传
使用控制: 实时策略校验、违规熔断
六、安全保障体系
6.1 三维安全架构
| 维度 | 核心要求 | 技术措施 |
|---|---|---|
| 数字合约安全 | 合约不可篡改、自动执行 | 智能合约、区块链存证 |
| 数字产品安全 | 数据可用不可见 | 加密传输、TEE、沙箱、隐私计算 |
| 空间运行安全 | 基础设施安全 | 连接器加固、DDoS防护、入侵检测 |
6.2 合规性设计
- 内置法规引擎:自动校验数据流通行为是否符合《数据安全法》《个人信息保护法》等法规
- 企业自定义规则:支持叠加企业内部的合规要求
- 跨境合规:对接欧盟GAIA-X等国际标准,提供"合规接口"
七、与物联网数据中台的关系
二者是互补协同的关系,而非替代:
┌─────────────────────────────────────────────────────────┐
│ 可信数据空间(跨企业流通层) │
│ 供应链协同数据 │ 行业数据共享 │ 公共数据运营 │
└─────────────────────────────────────────────────────────┘
↑
企业A可信数据空间连接器
↓
┌─────────────────────────────────────────────────────────┐
│ 企业A数据中台(企业内部整合层) │
│ IoT数据 │ ERP数据 │ CRM数据 │ 生产数据 │
└─────────────────────────────────────────────────────────┘
协同模式:
- 数据中台负责企业内部数据汇聚、治理、加工
- 可信数据空间连接器对接数据中台,将数据产品化后对外流通
- 企业内部敏感数据通过数据中台治理后,经由可信数据空间实现对外"可用不可见"共享
八、实施路线建议
阶段一(3-6月):基础能力建设
├── 部署可信数据空间服务平台(可采购成熟产品)
├── 核心参与方部署连接器
├── 建立身份认证与区块链存证体系
└── 完成1-2个试点场景(如供应链数据共享)
阶段二(3-6月):规模化推广
├── 扩展参与方规模(目标50+企业接入)
├── 丰富数据目录(目标100+数据产品)
├── 完善数字合约模板库
└── 建立收益分配机制
阶段三(6-12月):生态运营
├── 跨空间互联互通(对接行业/城市数据空间)
├── 大模型+可信数据空间融合创新
├── 跨境数据空间探索(如适用)
└── 形成可复制的运营模式
九、总结:核心设计原则
- 信任即算法:用技术和算法替代传统商业信任,建立可验证的确定性
- 数据主权优先:数据提供方始终保留控制权,"使用控制"而非"访问控制"
- 平台中立:服务平台只"管理"不"经手",避免平台方滥用数据
- 规则可编程:将法律规则、商业条款编译为可自动执行的数字合约
- 生态共赢:价值共创是可持续运营的根本动力
可信数据空间的本质,不是又一个技术平台,而是数字时代的"信任基础设施"------它让数据从"不敢、不愿、不能"共享,走向"敢共享、愿共享、能共享",真正释放数据作为生产要素的万亿级价值。