借助AI助手快速解析LlamaIndex的Workflow设计与Java迁移

在前面的讨论中,我们通过AI助手快速浏览并分析了LlamaIndex的核心源码及其可视化部分。在上次的工作中,我们已基本完成了使用Java版本实现的可视化部分,尽管在工作流(workflow)的分析上只是进行了初步探讨。今天,我们将深入探讨一个关键问题:能否将LlamaIndex在Python中的业务流程和核心代码,成功迁移并转化为Java版本。

接下来,我们将直接进入正题。首先,我们回顾一下LlamaIndex的整体架构和核心功能,然后着手进行Java版本的开发实现。

Workflow

可能大家已经有些遗忘了之前的细节,因此仅通过文字描述并记录下来,可能无法像可视化图示那样快速有效地帮助我们回忆起关键内容。为了更清晰地梳理思路,并帮助大家更直观地理解和回顾,我绘制一张简要的总结框架图。

简要总结框架图

首先,我们将从一个简洁的角度,回顾几个关键的核心类,并详细分析它们各自的属性和方法。如图所示:

剩下的部分就是至关重要的业务流程类 workflow 了。为了确保我们对整体业务流程有一个清晰的认知,我们可以先对业务流程进行一个简要的梳理。这里不需要过多关注细节,细节部分可以通过查看源码来进一步探讨。

好的,接下来我们将逐一通过AI助手来帮助我们完成代码转化的工作。虽然我们清楚地知道,AI的输出可能无法达到100%的完美效果,但即便如此,借助AI的辅助,至少可以大幅度提高效率,预计能够节省大约50%的编码时间。我们现在就开始吧。

设计

Event

同样直接询问助手即可。

接下来,我将根据AI助手提供的初步方案进行进一步的优化和调整。得到最终结果代码如下:

java 复制代码
@Data
@NoArgsConstructor
@AllArgsConstructor
@Accessors(chain = true)
@JsonInclude(JsonInclude.Include.NON_NULL)
 public abstract class  ToolEvent {

    /**
     * 事件id
     */
    private String eventId;

    /**
     * 事件name
     */
    private String eventName;

    /**
     * 存储各节点数据,并暴露出方法供其他人调用
     */
    private Map<String,Object> eventData = new HashMap<>();

    public ToolEvent(Map<String, Object> params) {
        this.eventData.putAll(params);
    }

    public Object get(String key) {
        key = this.getClass().getSimpleName() + "." + key;
        if (this.eventData.containsKey(key)) {
            return this.eventData.get(key);
        } else {
            throw new IllegalArgumentException("No such key: " + key);
        }
    }

    public void set(String key, Object value) {
        key = this.getClass().getSimpleName() + "." + key;
        this.eventData.put(key, value);
    }

    public boolean containsKey(String key) {
        key = this.getClass().getSimpleName() + "." + key;
        return this.eventData.containsKey(key);
    }

    public Set<String> keySet() {
        return this.eventData.keySet();
    }

    public Collection<Object> values() {
        return this.eventData.values();
    }

    public Set<Map.Entry<String, Object>> entrySet() {
        return this.eventData.entrySet();
    }

    public int size() {
        return this.eventData.size();
    }

    public boolean isEmpty() {
        return this.eventData.isEmpty();
    }

    public void clear() {
        this.eventData.clear();
    }

    public Map<String, Object> toMap() {
        return this.eventData;
    }

    /**
     * eventName默认为类名
     */
    public String getEventName() {
        if (this.eventName == null) {
            this.eventName = this.getClass().getSimpleName();
        }
        return this.eventName;
    }
}

可以看到,在此代码中我实现的是一个最基础的版本。我们并不打算在初期阶段实现所有功能,而是先着手于构建一个简化版的工作流系统。这样做的目的是先实现一个基础的可运行版本,再在此基础上进行优化和改进,以便最终得到一个更加高效且符合需求的解决方案。

接下来,实现工作流中的开始节点和结束节点的生成,这一过程同样相对简单。以下是相应的代码实现:

java 复制代码
@Data
@NoArgsConstructor
@Accessors(chain = true)
@JsonInclude(JsonInclude.Include.NON_NULL)
public class StartEvent extends ToolEvent {

    private String eventName = "start";
    public StartEvent(Map<String, Object> params) {
        super(params);
    }
}

@Data
@NoArgsConstructor
@Accessors(chain = true)
@JsonInclude(JsonInclude.Include.NON_NULL)
public class StopEvent extends ToolEvent {

    private String eventName = "end";
    /**
     * 结果返回
     */
    private String result;

    public StopEvent(String params) {
        result = params;
    }
}

LlamaIndex的事件封装了很多其他功能和细节,这些内容虽然很有用,但在当前阶段我们先不深入探讨。

Step注解

然后我们看下注解,这部分也可以询问下AI助手,如图所示:

不过Python的装饰器并不和Java注解一样,所以我们先来自己实现一下。

java 复制代码
@Retention(RetentionPolicy.RUNTIME)
@Target(ElementType.METHOD)
public @interface Step {

//    String eventName();
    Class<? extends ToolEvent>[] acceptedEvents();
    int numWorkers() default 10;

//    Class<?>[]  returnTypes();
//    RetryPolicy retryPolicy() default RetryPolicy.DEFAULT;
}

workflow

接下来,我们将着手实现工作流的主要流程。这一部分相对较为复杂,主要因为涉及的业务流程非常庞大且复杂,因此需要一定的时间和精力进行处理。为了简化我们的工作,首先我们可以参考AI助手的实现方式,通过分析其设计思路和工作原理,帮助我们更好地理解如何进行具体的实现。

在此基础上,我们再根据实际需求对流程进行必要的裁剪和优化。如下图所示:

最后,这部分代码有些多,我就简单的将主要流程写下来。代码如下:

java 复制代码
@Data
@Slf4j
public abstract class Workflow {

    /**
     * 工作流超时时间
     */
    private  int timeout = 10;
    /**
     * 是否输出详细日志
     */
    private  boolean verbose = false;

    /**
     * 校验开关
     */
    private boolean validation = false;
    /**
     * 校验开关
     */
    private boolean showUI = false;
    
    /**
     * 1:扫描当前类的所有带有 @Step 注解的方法
     * 2:根据步骤顺序,依次执行各个步骤
     */
    public String run(String jsonString) throws IOException{}
    /**
     *初始化工作流
     */
    private WorkflowContext initialContext() {}

WorkflowContext

最关键的因素在于工作流上下文的设计,因为在这种架构下,所有节点都能够共享全局变量。这一特性保证了工作流中不同节点之间的数据传递和协调,从而提高了整个系统的灵活性和便利性。如果没有这样的共享机制,工作流的效率和可操作性将大大降低,失去其原本的优势。

我们先去询问下AI助手如何实现。如图所示:

由于LlamaIndex提供了许多功能,因此其实现显得相对复杂。为了简化开发过程,我们决定剔除一些不必要的功能,比如类的序列化,这一功能主要用于恢复和加载工作流。然而,我们的目标是实现一个最基本且可行的工作流。最终代码如下:

java 复制代码
@Slf4j
@Data
public class WorkflowContext {
    /**
     * 是否是单步模式
     */
    private boolean stepwise;
    /**
     * 是否正在运行
     */
    private boolean isRunning;

    /**
     * 当前运行的事件
     */
    private ToolEvent stepEventHolding;

    /**
     * 事件队列:k:方法名,v:队列
     */
    private Map<String, ArrayBlockingQueue<ToolEvent>> eventQueue;

    private List<Thread> tasks = new ArrayList<>();

    private Map<String,Object> globalContext;

    private String result;
    //画图
    private Graph graph = new MultiGraph("workflow");
    public WorkflowContext(boolean stepwise){
          System.setProperty("org.graphstream.ui", "swing");
          this.stepwise = stepwise;
          this.isRunning = false;
          this.eventQueue = new ConcurrentHashMap<>();
          this.stepEventHolding = null;
          this.globalContext = new ConcurrentHashMap<>();
          this.result = null;
          //添加开始和结束节点
          Node nodeA = graph.addNode("start");
          Node nodeB = graph.addNode("end");
      }
      
    public void addThread(Thread thread) {
        tasks.add(thread);
    }
    
    public void sendEvent(ToolEvent value) {}

我们去除了一些东西,加了一个上一章节我们讨论的流的可视化。并且需要实现发布事件功能。

WorkflowHandler

最后加一个处理类,同样直接问一下AI助手,帮助我们去实现一下基本业务逻辑,如图所示:

然后我把所有没有用的逻辑全都去除掉,最后剩下这些代码,如下所示:

java 复制代码
@Slf4j
@Data
@AllArgsConstructor
public class WorkflowHandler {

    private WorkflowContext context;
    
    public void handleTask(int timeout){}

接下来,我们需要填充基本的业务逻辑部分,这一阶段的工作主要涉及实现具体的功能和处理流程,确保工作流能够按照预期正常运行。由于这部分代码涉及到特定的业务需求和内部实现细节,因此暂时不公开。工作流启动日志如下:

最终的效果如图所示:

总结

通过以上的分析和实践,我们成功地对LlamaIndex的核心功能进行了回顾,并逐步将其Python版的业务流程和核心代码迁移到Java实现。尽管在过程中遇到了一些挑战,如工作流的复杂性、事件和注解的差异等,但借助AI助手的辅助,我们能够高效地完成了代码转换和初步实现。

接下来的步骤,将是基于当前实现,进一步完善各个模块,优化工作流的执行效率,提升系统的可靠性和扩展性。


我是努力的小雨,一名 Java 服务端码农,潜心研究着 AI 技术的奥秘。我热爱技术交流与分享,对开源社区充满热情。同时也是一位腾讯云创作之星、阿里云专家博主、华为云云享专家、掘金优秀作者。

💡 我将不吝分享我在技术道路上的个人探索与经验,希望能为你的学习与成长带来一些启发与帮助。

🌟 欢迎关注努力的小雨!🌟

相关推荐
十二测试录3 小时前
【自动化测试】—— Appium安装配置保姆教程(图文详解)
经验分享·python·pycharm·jdk·node.js·appium·自动化
有过~5 小时前
Termora跨平台 SSH/SFTP/Terminal 客户端工具
运维·经验分享·ssh·电脑
罗汉松(山水白河)17 小时前
解除WPS登录限制
windows·经验分享·笔记·学习·wps
s_little_monster1 天前
【Linux】Linux常见指令(下)
android·java·linux·经验分享·笔记·学习·学习方法
合洁科技电子净化工程1 天前
合洁科技:晶圆洁净车间的净化空调系统和一般空调系统有何区别
经验分享·科技·其他·微信
努力的小雨1 天前
深入解析 Spring AI 系列:解析OpenAI接口对接
ai智能
小奥超人2 天前
忘记了PDF文件的密码,怎么办?
windows·经验分享·pdf·办公技巧
十二测试录2 天前
Android SDK下载安装(图文详解)
android·经验分享·python·程序人生·adb·自动化
小程序华东同舟求职2 天前
2025年VGC大众汽车科技社招入职测评综合能力英语口语SHL历年真题汇总、考情分析
经验分享·职场和发展·求职招聘
十二测试录2 天前
2024最新版Node.js下载安装保姆级教程【图文详解】
javascript·经验分享·程序人生·npm·node.js·appium