目录
基于区块链与联邦学习技术的数据交易平台
联邦学习与区块链的集成的优势在于能够确认参与各方的身份并实现学习过程追溯。
首先,通过的身份认证系统与定制化的联邦学习协议来解决交易各方身份确认的问题。
如图1所示,区块链系统保存了联邦学习系统中各参与方的数字证书,参与方采用基于双向认证的TLS协议构建的P2P通信链路进行通讯。如果通信时采用的证书无法通过区块链系统的认证,则通信协议中止传输。基于区块链的身份技术发展已经较为成熟,如W3C DID标准的提出以及基于该标准的Hyperledger Indy,但是在通信层目前主流的还是基于X509的PKI/CA认证机制。因此该部分的核心内容为在TLS协议的基础上,通过区块链的身份来替换传统的身份。
图 1:集成区块链身份认证的联邦学习方案
其次,利用区块链系统来解决联邦学习过程的溯源问题。区块链溯源的功能也集成在通信协议内部,其模型如图2所示。
在初始阶段,联邦学习系统发起学习任务的同时,将任务数据记录到区块链系统,包括任务发起者信息,参与方信息,训练脚本的哈希,初始模型哈希等。
图 2:联邦学习上链过程
在模型训练阶段,在每个数据供应方每次训练结束,除了更新模型数据,还将模型更新的指纹数据同步到区块链系统。
协调方对更新的训练数据验证后,将最新的模型经区块链相应途径发送给各个参与方,同时,将合并后模型的哈希以及模型评估结果的哈希记录到区块链系统。
上述模型通过数据指纹跟踪了联邦学习的全局模型数据的每次更新,实现了训练数据追溯,从机制上识别和抵御了诸如数据污染等对抗攻击、对于数据分布引起的算法偏差和倾斜也具备一定的溯源能力。