【机器学习】联邦学习 Federated Learning

有很多用户安装了Google的app,比如搜索引擎等。这些移动端的app都会搜集数据,产生数据。有些数据对于Google来说是有用的,所以Google想要建立一个机器学习模型,然后使用移动端的数据来训练机器学习模型。app把这些数据收集起来,发送到Google云端,然后Google在自己的集群上来训练模型,Google有足够的计算资源,这样不就解决了吗?但是事情不是这么简单的。假如有一个这样的限制,照片是隐私不想让Google传到云端上,那么如何训练机器学习模型呢?

每家医院都有自己的数据,可以用来训练自己的模型将实现预测等,但是每家的数据都不多,训练的效果也不好。最简单的方法就是将数据整合起来,在服务器上将模型进行训练。但是,用户数据不能轻易交给别人。

之前的时候学习过并行算法或者是分布式算,其中有一种编程模型,Parameter Server,我们可以用这种模型训练神经网络, 计算几乎都是Worker做的,Server端存储模型参数或者更新模型参数。

每一轮都要重复这样的操作:Worker向Server索要模型参数,然后Worker作本机计算,求出模型梯度。 Worker将计算出的梯度发送给Server,然后Server用梯度更新模型更新参数。

上述过程中,我们可以知道数据没有离开Worker,这样的话减少clock time的同时还保护了用户的隐私。联邦学习是一种分布式学习,联邦学习跟传统的分布式学习有很多不同:

  • 用户对他们的设备和数据有绝对的控制权
  • Worker节点不稳定
  • 通信代价比计算代价要高
  • 存储在Worker节点中的数据并不是独立同分布的(IID)
  • 节点负载不平衡
相关推荐
星辰AI1 分钟前
LLM 安全与对齐技术:构建可信赖的人工智能
人工智能·ai·语言模型
圣殿骑士-Khtangc4 分钟前
CloakBrowser 深度解析:C++ 源码级反检测浏览器,Playwright 的终极替代品
人工智能
05候补工程师16 分钟前
从算法理想向工程现实的跨越:SLAM 核心架构、思维误区与 Nav2 实战避坑指南
人工智能·算法·安全·架构·机器人
threelab20 分钟前
Three.js 加载 3D Tiles 瓦片数据 | 三维可视化 / AI 提示词
开发语言·前端·javascript·人工智能·3d·着色器
韦胖漫谈IT26 分钟前
不当输出处理 - 大语言模型 OWASP TOP 10系列
人工智能·语言模型·自然语言处理
JavaAgent架构师41 分钟前
前端AI工程化(九):AI Agent平台前端架构设计
前端·人工智能
阿里云大数据AI技术42 分钟前
DataWorks Data Agent:助力淘宝闪购一句话搞定数据开发,让周期从天级到分钟级
人工智能·agent
qcx2343 分钟前
【系统学AI】03 LLM训练全流程:预训练→SFT→对齐五条路线
人工智能·llm·sft·预训练·奖励模型·对齐·路线
秋91 小时前
WorkBuddy下载、安装和使用详解
人工智能
No8g攻城狮1 小时前
【AI工具】wsl2 + ubuntu22.04安装部署sub2api详细教程
人工智能·ai·go·vue