学者观察 | 基于区块链的隐私计算技术——北京理工大学教授祝烈煌

导语

祝烈煌老师认为区块链和隐私计算是实现数据安全可信共享流通的两个关键技术，两个技术各有侧重，区块链更多解决信任问题，隐私计算更多解决安全与隐私问题，两者的有机融合能够产生 1+1 大于 2 的效果。隐私计算的技术优势和面临的挑战往往一体两面，而区块链公开透明、去中心化、不可篡改等特征可以很好地助力其应对挑战** 。**

学者寄语

期待长安链与隐私计算深度融合，打造兼顾安全与效率的数据流通范式，加速培育健康可持续的数字经济新格局。

------北京理工大学教授祝烈煌

区块链和隐私计算是实现数据安全可信共享流通的两个关键技术，两个技术各有侧重，区块链更多解决信任问题，隐私计算更多解决安全与隐私问题，两者的有机融合能够产生1+1大于2的效果。

我国高度重视数据要素价值的释放，将数据和土地、劳动力、资本、技术等传统生产要素并列作为新型生产要素。数据价值释放需要共享流通，共享流通就会带来一些新问题：权限滥用、隐私保护、数据安全及数据可信等。例如在数据交易中，双方约定数据只能在一定的范围使用，但是数据滥用、无序地扩散等问题传统隐私保护技术不能胜任，面向数据流通的传统隐私保护技术亟待升级。

隐私计算是助力数据要素安全可信流通最重要的技术之一，可以保证数据提供方不泄露原始数据的前提下对数据进行分析计算，为数据的使用、加工、传输、提供等环节提供安全保障。随着产业发展与政策演进，隐私计算产业规模正在逐年扩大，需求日益增长。

隐私计算是一个技术体系，包括联邦学习、多方安全计算、可信执行环境、同态加密、零知识证明等，其技术优势和面临的挑战往往一体两面，而区块链公开透明、去中心化、不可篡改等特征可以很好地助力其应对挑战。具体而言，隐私计算重要的特点是实现数据"可用不可见"，即数据在计算过程中保持加密或不可见的状态，计算参与方无法获取明文数据本身。在实际应用中，该状态下数据的可信度 非常低，数据的计算结果验证也非常困难。同时，数据"不可见"给恶意用户作恶提供了条件，恶意用户可能会不按照协议执行 计算，造成计算效率低、计算结果不符但又很难被检查检测。隐私计算提升了数据在计算过程中的安全性与隐私性，虽能有效降低泄露风险，但其在面对恶意计算方时，由于缺乏对行为的可见性，导致检测非法操作的代价较高，存在一定局限。相比之下，区块链通过其可审计机制，实现对计算各环节的全程监督与追踪，使所有操作具备可验证性与可追溯性，且审计过程高效便捷，无需依赖中心化机构即可快速定位异常行为。同时，区块链上的智能合约能够自动执行协议逻辑，并在发现非法或异常行为时及时中止操作，防止协议被恶意篡改。二者结合，不仅构建了一个安全、可信、监管高效的计算环境，也使参与方在无需获取隐私数据的前提下，依然能够严格按照协议完成任务，提升系统的整体****可信性，****实现数据存、用、算、传全生命周期安全。

隐私计算中数据计算依赖中心存储，统一数据存储调度便于资源利用最大化，数据的访问控制、权限配置更加清晰明确。但同时存在潜在的单点故障风险，容易被攻击且不稳定。区块链技术的分布式特性，使数据由所有节点共同维护，无需中央机构介入。两者结合不仅可以实现数据一致性，还可以提升系统的抗攻击能力和可扩展性。

隐私计算可以实现原始数据本地存储、计算数据不出域，有效保护用户隐私。如联邦学习可支持多数据源联合建模，同时数据互不往来，不可追溯。如果计算方作恶或者出现其他意外情况也难以追溯，如遇中心服务器被攻击或遇意外情况则前功尽弃。区块链具有可追溯性，所有交易信息链式记录，可回溯每一个历史操作。虽然不能第一时间发现作恶行为，但是所有行为、操作结果都上链且公开透明，可以在事后追溯原因，形成威慑，提升系统整体可信性。

隐私计算的一些主流技术如联邦学习、多方安全计算、可信执行环境等都在尝试与区块链的结合。区块链与联邦学习的结合，可以提高学习模型的安全性。联邦学习本地模型汇聚的时候，模型质量参差不齐，有些模型质量非常高，有些质量却很差，如果把所有的本地模型都聚合在一起会产生很大的偏移甚至是错误。产生这个问题有可能本地端故意，也有可能数据被攻击或其他原因，不管如何，需要把质量很差的本地模型剔除。简单的方法是通过审计，但审计一方面效率低，另一方面可能会由于审计方的主观偏见或标准不同造成不公平。通过区块链合约的共识投票机制，区分出恶意模型与安全模型，仅将安全的模型参数上链。最终，通过联邦学习中的协调服务器聚合这些参数，构建出性能优秀的全局模型，并且对这样的优质模型和终端给予一定的奖励，反复迭代、逐步优化联邦学习效果。国际上康奈尔大学、新南威尔斯大学都提出相应的解决方案。

区块链与安全多方计算的结合，提高多方安全计算协议的可用性、公平性。安全多方计算有半诚实模型和恶意模型，半诚实模型计算效率相对高，但在恶意模型的计算中为抵抗恶意模型，需要大幅增加训练轮次，通信代价、计算代价都要提高一个数量级。利用区块链可以在一些有可能作恶的交互多方之间通过算法建立信任关系，把恶意模型转化为半诚实模型从而提高计算效率。比如说，所有的参与方在进行多方安全计算之前，向区块链管理层上缴一定的押金，如果发现作恶，首先把他抛弃，并扣除押金，另外从信誉度或者奖金各方面给予一定的惩罚，提高多方安全计算的可用性、公平性，国际上波兰华沙大学、以色列理工学院有一些代表性成果。

区块链与可信执行环境 的结合，可以实现链下安全计算链上安全存储。可信安全计算环境最被关心的问题是数据流转到TEE里，安全性是否可以得到保障，是否按照用户的意愿进行计算得到结果。区块链可以把相应的计算步骤、计算行为、关键参数等上链和追溯，确保给到的数据按照用户意愿进行计算，保证计算结果的可验证，这一点长安链基于TEE做了很多研究工作。

当前国内很多科研机构都在面向区块链与隐私计算融合进行研究，北京微芯区块链与边缘计算研究院将隐私计算与长安链 深度融合，使得长安链的去中心化、可信、可追溯的特性与隐私计算的数据"可用不可见"的特点互补结合。北京理工大学团队围绕区块链与隐私计算融合取得了多个成果。"基于区块链的高效纵向联邦学习框架"研究结合联盟链和阈值同态加密技术，提出针对多源垂直划分数据集的隐私保护支持向量机训练方案，实现了隐私保护与训练效率的双赢。基于零知识证明、数据扰动加密、区块链等技术，提出了可验证扰动加密协议，确保联邦学习中加密的本地梯度能被高效地验证，保证模型训练的鲁棒性，与已有方法相比，准确率提高2% 到 13%，同时可以防御主动推理攻击。北京理工大学还提出了基于区块链的动态数据共享激励机制，前面提到的技术更多解决用户"不敢"、"不能"共享数据的问题，该机制致力于解决用于"不愿"共享数据的问题。该研究是一种基于联盟链的多云数据共享模式，利用Shapley值构建多方数据共享的动态激励机制，实现多云数据的可靠共享。数据表明，基于该研究数据所有者收益比例与其共享样本数量正相关，可说明激励机制的可靠性。

另外，北京理工大学团队在基于区块链的跨域高效身份认证方法、基于区块链的隐私数据协同计算、基于区块链的同态加密等方面都进行了深入研究。