隐私计算背景
隐私计算 ,这几年被广泛的提起和应用,逐渐被大家熟知,这里我们不再针对具体的技术和知识点做介绍。
简而言之,隐私计算是一种实现数据"可用不可见"的技术,通过隐私计算,可有效地解决现存的数据合规流通的问题。
本文,我们重点梳理大的政策背景以及在行业应用落地的情况,以及未来的发展趋势做一些总结。
提起隐私计算,我们就不得不讲到数据、我们国家数据要素政策的大背景。
随着数字技术全面渗透到社会经济生活的各个方面,数字技术正在创造一种将人类社会政治和经济活动几乎所有方面"数据化"的新型经济,其核心是将社会经济生活过程最大程度数据化,并以数字的形式通过网络将人、机器和社会联结起来。在这个过程中,数据的作用日益重要,成为一种关键生产要素。

自2020年4月起,数据作为一种新型生产要素参与分配,是我国数字化建设的核心生产力之一。为完善数据要素治理制度,保障数据要素流通安全,我国政府出台了一系列数据安全相关的政策文件。在这一系列政策的大背景下,数据要素市场日渐活跃,数据要素合规有序流通的需求不断高涨 。
据国家工信安全中心测算数据,2020年我国数据要素市场规模达到545亿元,"十三五"期间市场规模复合增速超过30%;预计到2025年,我国数字要素市场规模将达到1749亿元。而如果考虑到数据价值链上的全部增值环节,则该市场的规模更大。
在数据要素这个大政策背景和庞大的市场需求下,数据要素合规有序流通的需求不断高涨,隐私计算由此被广泛提出(隐私计算并不是近期凭空被创造出来的一项新型技术,它是随着社会应用需求不断演变而形成的一套融合多种学科的技术体系框架),隐私计算走出学院派与实验室,广泛与行业应用场景相结合。
今年8月份,中国信通院云大所与隐私计算联盟共同撰写《隐私计算应用研究报告(2023年)》。报告预计,2025年中国隐私计算行业基础产品服务和数据运营市场规模分别达到95.9亿元和49.2亿元。
隐私计算赋能数据要素流程建设
不熟悉隐私计算的朋友,可能还不能很具象的想象出来,隐私计算在日渐活跃的数据要素市场到底解决了什么问题,我们从以下两个维度做一下说明:
政策方面
各国的数据安全法规相继出台,对企业安全合规地处理数据提出了更严格的要求,例如欧盟在2016年发布了《通用数据管理条例》,我国于2017年至今相继实施了《网络安全法》、《数据安全法》和《个人信息保护法》等
企业和用户方面
各机构与外部共享业务数据的同时,伴随着泄露商业秘密或是违反保护用户数据的义务的风险,相关企业却难以获得有效合规的数字资源,这一矛盾使得越来越多的企业呼唤一种新的数据治理和应用方案。
用户层面大家应该比较熟悉了,你手里的智能手机,你在购物、你在刷短视频时,都有很深的体会,近年来隐私泄露事件频发,用户对隐私的安全越来越重视,急需数据安全治理等相关的措施
隐私技术发展
一图胜千言,这里引用了一张图片,比较详细的描述了隐私计算的发展:

隐私计算的发展现状
2019年至今是隐私计算的应用期。2019年至今,在数据要素市场建设和数据价值发挥的时代背景下,产业需求快速增长,隐私计算走出学院派与实验室,广泛与行业应用场景相结合,赋能数据价值的安全、合规流转,各类隐私计算厂商也如雨后春笋一般涌现出来,激发了隐私计算技术可用性的快速提升:
隐私计算的行业应用
在信通院发布的《隐私计算应用研究报告(2023年)》中,我们能够看到隐私计算产品招标逐年递增,应用场景丰富、细化。
上述调研报告中,我们也可以观察到,多种技术融合的应用解决方案已逐渐成为各场景的主要技术应用模式。以金融、政务和通信行业为例,都用到了三种以上的隐私计算技术,其中软硬结合的方式也成为了各行业探索的重点方向。

以金融保险行业为例
以我所熟悉的金融保险行业为例: 在精准营销,精准定价,风控,智能核保,反欺诈等等场景都有所应用,来提高保险公司的业务效率、降低成本、提高服务质量、增强风险控制能力等。
在理赔场景中,更是同时融合了多种技术,比如基于气象数据的自动理赔场景,气象数据的安全性基于隐私计算技术来保障,自动理赔场景的场景基于区块链技术来实现。
管中窥豹,各行各业在积极探索、创新,来充分投入到数据要素流通的浪潮中。
隐私计算的发展路径
首先是隐私计算自身产品主体仍需在技术实施、业务成本、合规保障上进行优化,进一步提升应用增长规模;其次隐私计算在各行业的数据流通场景上仍需加速探索;最终隐私计算在构建高效集约的基础设施、助力数据交易流通的互联互通、安全合规跨境流通等多方面,更加适配数据要素流通制度,加速释放数据要素价值。
隐私计算的应用难点
在这几年隐私计算的工程化和场景落地方面,并不乐观,还存在着很多难点和痛点:
1.互通性问题:
生态壁垒是重要问题。隐私计算号称可以解决数据孤岛,但实际上,它反而会诞生技术孤岛问题。目前各家隐私计算的技术互不相通,也无法互相连接。但业内实现的程度大多是停留在软件层的集成,应用中仍涉及大量人工改写的工作。
不仅仅在技术实现层面,这种互不相通也源自一些主观因素。各家企业考虑到安全性和知识产权的问题,除了在一些开源组件上,其它方面不愿意公开自己的底层协议。这也带来了协议不透明的问题,导致安全性难以审计,蕴含明显的安全漏洞。
同样,以我在行业应用场景列举的金融保险为例,我们想使用蚂蚁的数据来做精准营销和联合定价,他们有自己的蚂蚁隐私计算节点;与字节、银行等合作时,他们又各自有自己的隐私计算技术,而这些平台又不能做到互联互通,给实际的业务场景落地带来很大困难,同时又要耗费大量的人力物力。
2.场景落地能力和工程化问题是为"大难关"
这两年隐私计算看到的全是单点的、尝试性的,实验性的进展,什么时候能真正达到商用级别,把规模做起来,这才是我更想看到的,也是行业更需要去努力的方向。
3.技术成熟度还不够
目前的产品实用性和稳定性,设计软件是否稳定可靠,能否支持大规模的数据吞吐量,目前尚未经历大规模商用化验证。
随着多方数据交换需求的到来、5G和物联网的发展所带来的数据量急剧增大,带来数据量爆发式的增长,算力是否能够满足工程化的要求。
隐私计算的未来展望

笔者认为:
- 隐私计算在未来的发展中,一方面离不开政策的不断推进和落地,同时,要从国家顶层进行框架级,协议级的设计,建立规范和标准,能够做到互联互通,使其具有普适性,同时产品的服务形态多元化,能够促进各行各业对于数据要素的流通和使用
- 在关键技术上,解决计算效率不高的问题,来应对数据量爆发式的增长,使得在工程化的应用中,能够支持大规模的数据吞吐量
- 从国家的角度,进一步健全合规的体系建设:
隐私计算的使用和合规不能划等号,不能武断地认为使用隐私计算就百分之百合规。 - 软件的终极发展是硬件,当有一天,我们真正实现了数据要素的互联互通,存储和计算,是真正考验底层能力的时候:
"去IOE化"现在已经是战略级的操作,2020年国家开始全面推广信创产业,其中涉及芯片、服务器的国产替代,于隐私计算软硬结合而言,也必须未雨绸缪,寻求芯片"国产自主可控"的后路,这是算力提升当中最艰难的部分,也将是隐私计算基建的核心和决赛赛道。