【大模型】Langchain4j

流式问题

使用流式输出,却在浏览器中无法看到流式响应。

Mac中的Safari浏览器和Postman默认模式下是不支持流式响应的。

想要验证流式响应,可以使用命令

powershell 复制代码
curl -v -N "http://localhost:8080/chatStream?message=%E8%AF%B7%E5%B8%AE%E6%88%91%E7%94%9F%E6%88%90%E4%B8%80%E7%AF%871000%E5%AD%97%E7%9A%84%E5%B0%8F%E5%AD%A6%E4%BD%9C%E6%96%87"

由于Mac使用的ARM架构的芯片,所有对于Netty依赖,需要做下面改动。

xml 复制代码
        <dependency>
            <groupId>io.netty</groupId>
            <artifactId>netty-resolver-dns-native-macos</artifactId>
            <version>4.1.78.Final</version>
            <classifier>osx-aarch_64</classifier>
        </dependency>

会话隔离

由于会话存储历史记录使用的是同一个记忆存储对象,因此多次会话的记忆没有做到隔离。这里我们需要使用memoryID来实现不同会话直接的隔离效果。

会话隔离实践

  1. 定义会话记忆对象提供者
  2. 配置会话定义对象提供者
  3. ConsultantService接口方法中添加参数memoryID
  4. Controller中Chat接口接收memoryID
  5. 前端页面请求时传递memoryID

使用Redis进行存储对应的会话历史信息,这里需要实现下面接口:

java 复制代码
public interface ChatMemoryStore {
    List<ChatMessage> getMessages(Object memoryId);
    void updateMessages(Object memoryId, List<ChatMessage> messages);
    void deleteMessages(Object memoryId);
}

RAG知识库

检索增强生成(Retrieve Augmented Generatered):其实RAG就相当于增强prompt。

使用RAG中的流程:

知识库需要使用到向量数据库:

milvus向量数据库。

Tools工具

功能场景,在大模型与用户沟通过程中,可以在回答中添加一些信息或者收集一些信息。

也就是读取MySQL中的数据,并通过AI问答展示出来。

Tools工具原理

之前叫做Function Calling;当用户表现出预约意向时,调用对应的服务进行信息收集与预约,就需要使用到当前功能,也就是在问答中调用增删改查。

这里会用到两个注解,一个是 @Tool 注解,另一个是 @P 注解;

@Tools注解为方法注解,标注当前的方法会被Agent调用,@P注解为入参注解,标注每个入参映射的具体名称。

最后在@AiService注解中将包含@Tools和@P注解的类名进行注册;tools=类名;

这样就可以在对话中调用增删改查服务。

相关推荐
iiiiyu14 小时前
集合进阶(Map集合)
java·大数据·开发语言·数据结构·编程语言
小江的记录本14 小时前
【Java基础】核心关键字:final、static、volatile、synchronized、transient(附《思维导图》+《面试高频考点清单》)
java·前端·数据结构·后端·ai·面试·ai编程
tongluowan00714 小时前
Java 内存模型(JMM)- 内存屏障
java·内存模型·内存屏障
月落归舟15 小时前
并发编程之volatile深度解析(二)
java·开发语言·volatile
me83215 小时前
【AI】踩坑LangChain4j集成千问模型:版本适配问题完整解决历程
java·spring·阿里云·ai
来恩100315 小时前
Java Web三大作用域对象
java·开发语言·前端
ゆづき15 小时前
Java 初学者入门指南:常见问题 + 核心知识点 + 进阶 20 道练习题
java·开发语言·学习·算法·水题
_Evan_Yao15 小时前
限流的艺术:令牌桶与滑动窗口的博弈,以及我为何在 AI 项目中选择了后者
java·后端·架构
LIUAWEIO15 小时前
接口 data 满屏反斜杠,怎么展开?
java·开发语言·数据库·json在线解析·data是字符串·json转义·二次json