Java大模型开发入门 (7/15):让AI拥有记忆 - 使用LangChain4j实现多轮对话

前言

在上一篇文章中,我们成功地"驯服"了AI,让它能够按照我们的指令返回结构化的Java对象。这是一个巨大的进步,但我们的Assistant依然存在一个致命的弱点:它完全没有记忆

你和它的每一次交互都是一次全新的开始。你告诉它"我叫张三",它礼貌地回应;紧接着你问"我叫什么名字?",它只会一脸茫然地回答"我不知道"。这就像和一条只有七秒记忆的金鱼对话,无法形成真正有意义的交流。

今天,我们将解决这个核心痛点。我们将探索LangChain4j中强大的**记忆(Memory)**机制,为我们的AI助手装上"记忆芯片",打造一个能真正联系上下文、进行多轮对话的智能聊天机器人。

第一部分:为什么需要记忆?无状态对话的痛点

HTTP协议本身是无状态的,这意味着每一次API请求都是独立的。当我们调用大模型API时,默认情况下,模型也不知道这次请求和上一次请求有任何关联。

为了让模型理解上下文,我们必须在每次请求时,都把之前的对话历史一起发送给它。一个包含了对话历史的请求体(Payload)看起来是这样的:

json 复制代码
{
  "model": "deepseek-chat",
  "messages": [
    { "role": "user", "content": "你好,我叫张三。" },
    { "role": "assistant", "content": "你好,张三!很高兴认识你。有什么可以帮你的吗?" },
    { "role": "user", "content": "我叫什么名字?" } // <-- 当前问题
  ]
}

只有当模型看到完整的messages列表时,它才能正确回答"你的名字是张三"。

手动管理这个messages列表非常繁琐:你需要自己存储每一轮的对话,并在下一次请求时重新构建这个列表。而LangChain4j的ChatMemory机制,就是为了将我们从这个繁琐的工作中彻底解放出来。

第二部分:LangChain4j的记忆核心:ChatMemory

ChatMemory是LangChain4j中用于处理对话历史的组件。它的工作原理非常简单:

在每次与AI交互之后 ,它会自动保存用户提问和AI的回答。

在下一次与AI交互之前,它会自动加载已保存的对话历史,并将其添加到发送给AI的提示中。

这一切都在后台自动发生,对我们开发者来说几乎是透明的。

LangChain4j提供了多种ChatMemory的实现,最常用的是:

  • MessageWindowChatMemory:只保留最近的N条消息。这是一种简单有效的策略,可以防止对话历史过长,导致API请求成本过高或超出模型的Token限制。
  • TokenWindowChatMemory:更精确的控制方式,只保留最近的N个Token内的消息。
第三部分:实战:为每个用户提供独立的记忆

在Web应用中,我们不能只有一个全局的记忆,否则所有用户的对话都会混在一起。我们需要为每一个独立的对话(或用户)提供一个独立的记忆实例 。LangChain4j为此提供了ChatMemoryProvider

ChatMemoryProvider可以被看作一个Map<ConversationId, ChatMemory>。它根据你提供的唯一对话ID,来存取对应的聊天记录。

1. 创建ChatMemoryProvider Bean

在我们的config包下,修改LangChain4jConfig.java,添加一个ChatMemoryProvider的Bean。

java 复制代码
package com.example.aidemoapp.config;

// ... other imports
import dev.langchain4j.memory.ChatMemory;
import dev.langchain4j.memory.chat.ChatMemoryProvider;
import dev.langchain4j.memory.chat.MessageWindowChatMemory;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

@Configuration
public class LangChain4jConfig {

    // ... chatLanguageModel Bean ...

    @Bean
    public ChatMemoryProvider chatMemoryProvider() {
        // 这个Bean会为每个用户(由memoryId标识)创建一个MessageWindowChatMemory实例
        // withMaxMessages(10)表示每个对话最多保留最近的10条消息
        return memoryId -> MessageWindowChatMemory.withMaxMessages(10);
    }
}

2. 将记忆提供者关联到AI服务

现在,我们需要告诉@AiService使用我们刚刚创建的ChatMemoryProvider

修改Assistant.java接口:

java 复制代码
package com.example.aidemoapp.service;

import dev.langchain4j.service.MemoryId;
import dev.langchain4j.service.SystemMessage;
import dev.langchain4j.service.spring.AiService;

// 使用chatMemoryProvider属性,指向我们定义的Bean的名字
@AiService(chatMemoryProvider = "chatMemoryProvider")
public interface Assistant {

    // 在需要记忆的chat方法中,增加一个用@MemoryId注解的参数
    @SystemMessage("You are a polite and helpful assistant.")
    String chat(@MemoryId String conversationId, String userMessage);
}

代码解析

  • @AiService(chatMemoryProvider = "chatMemoryProvider"):将Assistant与我们定义的记忆提供者Bean关联起来。
  • @MemoryId String conversationId:这是最关键的一步。我们为chat方法增加了一个参数,并用@MemoryId注解它。LangChain4j会把传入这个参数的值(比如用户ID或Session ID)作为从ChatMemoryProvider中存取ChatMemory的Key。
第四部分:改造Controller并进行测试

最后,我们需要修改ChatController,以便在API请求中传入这个conversationId

java 复制代码
package com.example.aidemoapp.controller;

// ... imports

@RestController
@RequestMapping("/api/v2/chat")
@RequiredArgsConstructor
public class ChatController {

    private final Assistant assistant;

    @GetMapping
    public String chat(@RequestParam("id") String conversationId, // 新增id参数
                       @RequestParam("message") String message) {
        return assistant.chat(conversationId, message);
    }

    // ... 其他方法 ...
}

测试我们的记忆功能!

现在,你可以用不同的id来模拟不同的用户对话。

  1. 开启对话1 (id=user123)

    请求URL: http://localhost:8080/api/v2/chat?id=user123&message=你好,我叫张三

    AI可能会回答: 你好,张三!很高兴认识你。

  2. 继续对话1

    请求URL: http://localhost:8080/api/v2/chat?id=user123&message=我叫什么名字?

    AI现在应该回答: 你的名字是张三。 (成功!它记住了!)

  3. 开启一个全新的对话2 (id=user456)

    请求URL: http://localhost:8080/api/v2/chat?id=user456&message=我叫什么名字?

    AI应该回答: 抱歉,我不知道你的名字。 (成功!不同用户的记忆是隔离的!)

  4. 为对话2提供信息

    请求URL: http://localhost:8080/api/v2/chat?id=user456&message=我叫李四

    AI可能会回答: 好的,李四。

  5. 再次测试对话1的记忆

    请求URL: http://localhost:8080/api/v2/chat?id=user123&message=我叫什么名字?

    AI依然回答: 你的名字是张三。 (成功!记忆没有被混淆!)

总结

今天,我们为AI助手解决了"失忆症"这个最大的痛点。通过使用LangChain4j的ChatMemoryProvider@MemoryId注解,我们以一种极其优雅和简单的方式,实现了可持久化的、按用户隔离的多轮对话能力。

我们的AI助手现在不仅能"说会道",还能"过耳不忘",这让它离一个真正的智能应用更近了一大步。

到目前为止,我们的AI助手的所有知识都来源于它预训练时所用的通用数据。但如果我们想让它成为一个特定领域的专家,比如让它学习我们公司的内部产品文档、技术手册,并基于这些私有知识来回答问题,该怎么做呢?


下一篇预告:

Java大模型开发入门 (8/15):连接外部世界(上) - RAG入门与文档加载》------ 我们的AI已经很会"聊"了,但它只知道公开的知识。如何让它学习我们的私有文档(如PDF、Word)并回答相关问题?我们将开启通往构建企业级知识库问答机器人的核心技术------RAG(检索增强生成)之旅!

相关推荐
RainbowSea5 分钟前
跨域问题(Allow CORS)解决(3 种方法)
java·spring boot·后端
掘金-我是哪吒6 分钟前
分布式微服务系统架构第155集:JavaPlus技术文档平台日更-Java线程池实现原理
java·分布式·微服务·云原生·架构
坤坤爱学习2.07 分钟前
求医十年,病因不明,ChatGPT:你看起来有基因突变
人工智能·ai·chatgpt·程序员·大模型·ai编程·大模型学
RainbowSea10 分钟前
问题 1:MyBatis-plus-3.5.9 的分页功能修复
java·spring boot·mybatis
前端 贾公子13 分钟前
monorepo + Turborepo --- 开发应用程序
java·前端·javascript
蹦蹦跳跳真可爱58942 分钟前
Python----循环神经网络(Transformer ----注意力机制)
人工智能·深度学习·nlp·transformer·循环神经网络
不学会Ⅳ1 小时前
Mac M芯片搭建jdk源码环境(jdk24)
java·开发语言·macos
虫小宝1 小时前
高佣金返利平台监控体系建设:APM、链路追踪与佣金异常预警系统技术实现
java
sniper_fandc2 小时前
SpringBoot系列—入门
java·spring boot·后端
空中湖3 小时前
tensorflow武林志第二卷第九章:玄功九转
人工智能·python·tensorflow