How to understand the Trusted Intelligent Computing Service in Huawei Cloud
概述
什么是TICS
可信智能计算服务TICS( Trusted Intelligent Computing Service )打破数据孤岛,在数据隐私保护的前提下,实现行业内部、各行业间的多方数据联合分析和联邦计算。TICS基于安全多方计算MPC、区块链等技术,实现了数据在存储、流通、计算过程中端到端的安全和可审计,推动了跨行业的可信数据融合和协同。
产品架构
- 联盟管理
邀请云租户作为数据提供方,动态构建可信计算联盟,实现联盟内严格可控的数据使用和监管。
- 数据融合分析
支持对接多个数据参与方的主流数据存储系统,为数据消费者实现多方数据的SQL Join等融合分析, 各方的敏感数据在具有安全支撑的聚合计算节点中实现安全统计。
- 计算节点
数据参与方使用数据源计算节点模块实现自主可控的数据源注册、隐私策略(敏感,非敏感,脱敏)的设定、元数据的发布等,为数据源计算节点提供全生命周期的可靠性监控、运维管理。
- 可信联邦学习
对接主流深度学习框架实现横向和纵向的联邦训练,支持基于安全密码学(如不经意传输、差分隐私等)的多方样本对齐和训练模型的保护。
- 数据使用监管
为数据参与方提供可视化的数据使用流图,提供插件化的区块链对接存储,实现使用过程的可审计、可追溯。
- 容器化部署
容器化的多方数据源计算节点、聚合计算节点的部署管理,支持云上、边缘、HCS多种部署模式。
TICS规格说明
规格 | 服务内容 |
---|---|
联邦SQL分析 | 支持 |
横向联邦学习 | 支持 |
纵向联邦学习 | 支持 |
产品优势
- 多域协同
支持在分布式的、信任边界缺失的多个参与方之间建立互信联盟;
实现跨组织、跨行业的多方数据融合分析和多方联合学习建模。
- 灵活多态
支持对接主流数据源(如MRS, DLI, RDS, Oracle等)的联合数据分析;
支持对接多种深度学习框架(TICS,TensorFlow)的联邦计算;
支持控制流和数据流的分离,用户无需关心计算任务拆解和组合过程,采用有向无环图DAG实现多个参与方数据流的自动化编排和融合计算。
- 自主高效
数据使用全流程可视化展示,为数据参与方提供可感知、可监测的数据使用过程;
支持数据参与方、计算方的多种部署模式,包括云上(同Region、跨Region)、边缘节点、HCSO的部署模式;
采用容器化资源/部署管理,支持调度方、数据参与方、计算方的弹性扩缩容。
- 安全隐私
支持用户自定义隐私策略,实现敏感数据的识别、脱敏、水印保护,最大程度的保障隐私数据安全;
多方协同过程中隐私信息交互(SQL JOIN数据碰撞、可信联邦学习模型参数)的加密保护;
支持安全多方计算,如基于隐私集合求交PSI(Private Set Intersection)技术的多方样本对齐, 基于差分隐私、加法同态、秘密共享等技术的训练模型保护;
可插件化的对接区块链存储,实现多方数据的流动轨迹、使用过程的全程可追溯、可审计。
产品功能
- 动态联盟管理
动态构建可信计算联盟,实现联盟内严格可控的数据使用和监管。联盟是联邦计算的载体,合作方只有加入联盟才能参与联邦计算。
- 安全的作业管理
作业时,数据使用的过程可审计、可追溯。TICS数据集成支持多方安全计算、可信联邦学习和联邦预测作业等作业方式。
(1)、多方安全计算
多方安全计算是可信智能计算提供的关系型数据安全共享和分析功能,曾经被称为联邦数据分析。您可以创建多方安全计算作业,根据合作方已提供的数据,编写相关sql作业并获取您所需要的分析结果,同时能够在作业运行保护数据使用方的数据查询和搜索条件,避免因查询和搜索请求造成的数据泄露。
(2)、可信联邦学习
可信联邦学习是可信智能计算服务提供的在保障用户数据安全的前提下,利用多方数据实现的联合建模,曾经被称为联邦机器学习。
(3)、联邦预测作业
联邦预测作业在保障用户数据安全的前提下,利用多方数据和模型实现样本联合预测。
- 可信智能计算节点
数据参与方使用数据源计算节点模块实现自主可控的数据源注册、隐私策略(脱敏、加密)的设定、元数据的发布等,为数据源计算节点提供全生命周期的可靠性监控、运维管理。
- 多方融合分析
对接多种主流数据存储系统,为数据消费者实现多方数据的融合分析,参与方敏感数据能够在聚合计算节点中实现安全计算。
- 多方联邦训练
对接主流深度学习框架实现横向和纵向联邦建模,支持基于SMPC(如不经意传输、同态加密等)的多方样本对齐和训练模型保护。
- 云端容器化部署
参与方数据源计算节点云原生容器部署,聚合计算节点动态扩容,支持云、边缘、HCSO多种部署模式。
- 可视化数据监管
为数据参与方提供可视化的数据使用流图,提供插件化的区块链对接存储,实现使用过程的可审计、可追溯。
- 智能风控服务
应用在金融领域(银行、保险、证券)风控平台等系统中,解决这些系统所面临的大数据量,高并发,低时延,水平扩展,业务编程,多租户等瓶颈问题。
应用场景
政企信用联合风控
金融机构对于中小微企业的信用数据通常不足,央行征信数据覆盖率有限,不良企业多家骗贷事件屡有发生。金融机构与政府部门,如税务部门、市场监管部门、水电公司等在保护各方原始数据隐私的前提下,通过多方联合建模,金融机构补充了风控模型特征维度,提升模型准确率。
优势:
- 提升模型准确率
多方机构实现算法层面联合建模,提升了需求方模型的预测效果。
- 数据隐私保护强
多方采用隐私集合求交PSI对齐样本数据,本地数据或模型加密后在安全环境中运算,实现数据可用不可得。精细化的数据隐私保护策略,确保分析结果中强制执行隐私数据的脱敏。
政府数据融合共治
由于数据安全以及隐私保护问题,政府各委办局数据尚未充分共享。多委办厅局数据的融合碰撞对于政府业务共治起到关键作用,例如本次疫情联防联控、综合治税等业务场景。共治场景均要实现在保护数据隐私的前提下,通过多个局委办数据的融合分析,得到数据碰撞结果,提升政府业务的治理效能。
优势:
-
政府多委办局之间密文数据融合计算,实现多方数据的融合分析。
-
基于隐私集合求交实现多方安全SQL JOIN分析, 原始数据保存在各个用户本地,统计分析算子下推到本地数据域执行。
-
多方分析JOIN算子进行数据隐私保护,计算过程将多方加密后数据完成计算,计算结果加密返回给数据使用方。
-
支持自定义脱敏保护策略,设定SQL语句安全等级检查,防止非法SQL执行。
金融联合营销
传统金融企业联合营销模式中,金融企业往往需要将双方的数据集中到一个安全实验室中进行标签融合,模型训练,但常面临数据泄露和隐私等挑战。联邦建模采用分布式架构进行部署和建模,参与联合营销的企业原始和明细数据不出库的前提下进行跨域数据建模,实现精准营销,同时保障企业数据安全与个人隐私。
优势:
-
原始数据不出企业安全域、不出库,实现"数据不动、算法动",数据使用自主可控。
-
联合多方正样本的效果,丰富模型的特征,提高模型的泛化能力。
-
计算全程保障企业数据安全与个人隐私。
使能数据交易
传统数据交易方式,交易的是数据所有权,交易完成后,数据被无限制的拷贝和复制。采用可信交易方式,交易的不是数据,而是数据的使用权,卖家卖的是对某个数据的用法用量,不用担心数据被拷贝和复制。
优势:
- 数据不离开卖家,更放心。
- 卖家控制"隐私规则",控制"用法和用量"。
- 支持三层异构,跨组织、跨地域、跨数据源。
- 低成本部署,支持边缘模式单节点部署。
快速入门
TICS快速入门
TICS使用流程简介
可信智能计算服务TICS( Trusted Intelligence Computing Service )打破数据孤岛,在数据隐私保护的前提下,实现行业内部、各行业间的多方数据联合分析和联邦计算。TICS基于安全多方计算MPC、区块链等技术,实现了数据在存储、流通、计算过程中端到端的安全和可审计,推动了跨行业的可信数据融合和协同。
使用TICS的用户角色
根据人员的职能进行划分,使用TICS的用户主要可以分为以下两类。
组织方
面向熟悉业务并具有管理、决策、审核权限的管理人员。组织方具有TICS的所有权限,包括创建联盟、邀请联盟成员、删除联盟等权限。例如,在创建联盟模块中,组织方可以对合作方人员发布的数据进行审核,把好质量关。
合作方
合作方使用数据源计算节点模块实现自主可控的数据源注册、隐私策略(脱敏、加密、水印)的设定、元数据的发布等,为数据源计算节点提供全生命周期的可靠性监控、运维管理。
TICS使用流程简介
TICS典型的端到端开发流程如下图所示
入门实践
实践 | 描述 |
---|---|
基于TICS实现端到端的企业积分查询作业 | 本最佳实践提供了通过统一制定隐私规则,使用TICS进行安全计算,避免真实数据被窃取的使用案例。 |