FATE联邦学习框架java实践(二)

同系列文章:

FATE联邦学习框架入门指南 - 掘金 (juejin.cn)

FATE联邦学习框架:API实践Upload和DownLoad的踩坑记录 - 掘金 (juejin.cn)

FATE联邦学习框架java实践(一) - 掘金 (juejin.cn)
项目源码FateTest - 码云 - 开源中国 (gitee.com)

FATE联邦学习框架java实践(一)经过重重困难实现了Fate的数据上传和下载。

现在对于一个完整Fate实践的功能流程,还差数据更新上传执行任务。因此本篇主要实现数据更新功能和上传任务的功能。

1. Fate的数据更新功能

Fate并没有提供表中数据的更新功能,因此想要实现数据更新,只能是下载数据->程序更新数据->数据上传

graph LR 下载数据文件 --> 数据追加写入文件 --> 文件更新后上传Fate

下载数据后解压为csv文件的方法 以及数据上传到Fate的方法 已经实现,还需要实现的是数据追加写入文件的方法。

  1. 文件根路径已经固定在Apollo配置,如有需要自行配置。
  2. 函数基本逻辑为将数据追加写入到指定命名的csv文件中,如果文件不存在或直接生成csv文件后写入
  3. 生成csv文件插入了表头(id),如有需要自行配置。

函数路径:

为了可靠性,数据更新方法会校验三个过程中的错误码,如果有一个流程执行失败,那么就会返回其失败的错误码。

数据更新方法源码路径如下:

2. 上传Fate任务功能

根据官网API文档:API - FATE Flow (federatedai.github.io),上传任务的接口实现起来非常简单,如下图。

但是其请求参数的设置却非常复杂。

参考FATE联邦学习框架入门指南 - 掘金 (juejin.cn)中对DSLCONF的描述,先大致了解一下任务配置参数的概念。

接下来,我们需要做就是在JAVA中实现对参数的配置。如图,任务参数其实是一个嵌套的JSON,所以,要更改JSON中对应的参数并不容易。

一个好消息,因为我自己这里是固定一个隐私求交集的任务,所以对于任务模块和partID这些参数都是固定死的,我需要更改的只有求交双方的表名。

经过技术调研,我们最后选择用jackSon对JSON解析后进行更改的方式进行任务参数配置。

3. 任务状态查询功能

事实上,上传数据在Fate中也被认为是一个任务,所以在新的数据覆盖上传之前,我们不能去提交隐私求交任务。

因此,我们需要知道任务是否完成。

虽然,Fate提交任务并非任务成功后才返回值,但是Fate提供了任务状态查询接口让我们能够知道任务是否完成。

如图,接口实现如下:

通过轮训这个接口,我们就能够知道任务是否已完成。对于任务查询接口的返回值官网没有明确说明,好在我已经一个一个都给你们试出来了。

  1. 任务处在running、waiting、ready的状态,设置了等待时长,因为任务执行时间过长(一般两分钟),高频率的轮询请求不太合理。
  2. 只有任务明确了成功(status为success)或者失败的状态才会结束轮询。
  3. 目前我还没见过其他的非失败状态,所以增加了打点,防止错漏。
java 复制代码
while(!allUpdateJobFlag){
    // 跟踪任务进行状态
    boolean updateJobFlag = true;
    for (int i = 0; i < tmpIdList.size(); i++){
        String status = fateService.jobQuery(tmpId);
        if (StringUtils.equalsIgnoreCase(status, "success")){
            // 进行隐私求交任务
        }else if(StringUtils.equalsIgnoreCase(status, "running")){
            Thread.sleep(1000);
            updateJobFlag = false;
        }else if(StringUtils.equalsIgnoreCase(status, "waiting")){
            Thread.sleep(1000);
            updateJobFlag = false;
        }else if(StringUtils.equalsIgnoreCase(status, "ready")){
            Thread.sleep(1000);
            updateJobFlag = false;
        }else{ // 任务失败直接略过
            Cat.logEvent("status",status);
        }
    }
    allUpdateJobFlag = updateJobFlag;
}
相关推荐
天行健的回响2 分钟前
枚举在实际开发中的使用小Tips
后端
on the way 1234 分钟前
行为型设计模式之Mediator(中介者)
java·设计模式·中介者模式
保持学习ing7 分钟前
Spring注解开发
java·深度学习·spring·框架
wuhunyu7 分钟前
基于 langchain4j 的简易 RAG
后端
techzhi7 分钟前
SeaweedFS S3 Spring Boot Starter
java·spring boot·后端
异常君32 分钟前
Spring 中的 FactoryBean 与 BeanFactory:核心概念深度解析
java·spring·面试
weixin_461259411 小时前
[C]C语言日志系统宏技巧解析
java·服务器·c语言
databook1 小时前
概率图模型:机器学习的结构化概率之道
python·机器学习·scikit-learn
cacyiol_Z1 小时前
在SpringBoot中使用AWS SDK实现邮箱验证码服务
java·spring boot·spring
AI视觉网奇1 小时前
调试快捷键 pycharm vscode
机器学习