【大模型】Langchain4j

流式问题

使用流式输出,却在浏览器中无法看到流式响应。

Mac中的Safari浏览器和Postman默认模式下是不支持流式响应的。

想要验证流式响应,可以使用命令

powershell 复制代码
curl -v -N "http://localhost:8080/chatStream?message=%E8%AF%B7%E5%B8%AE%E6%88%91%E7%94%9F%E6%88%90%E4%B8%80%E7%AF%871000%E5%AD%97%E7%9A%84%E5%B0%8F%E5%AD%A6%E4%BD%9C%E6%96%87"

由于Mac使用的ARM架构的芯片,所有对于Netty依赖,需要做下面改动。

xml 复制代码
        <dependency>
            <groupId>io.netty</groupId>
            <artifactId>netty-resolver-dns-native-macos</artifactId>
            <version>4.1.78.Final</version>
            <classifier>osx-aarch_64</classifier>
        </dependency>

会话隔离

由于会话存储历史记录使用的是同一个记忆存储对象,因此多次会话的记忆没有做到隔离。这里我们需要使用memoryID来实现不同会话直接的隔离效果。

会话隔离实践

  1. 定义会话记忆对象提供者
  2. 配置会话定义对象提供者
  3. ConsultantService接口方法中添加参数memoryID
  4. Controller中Chat接口接收memoryID
  5. 前端页面请求时传递memoryID

使用Redis进行存储对应的会话历史信息,这里需要实现下面接口:

java 复制代码
public interface ChatMemoryStore {
    List<ChatMessage> getMessages(Object memoryId);
    void updateMessages(Object memoryId, List<ChatMessage> messages);
    void deleteMessages(Object memoryId);
}

RAG知识库

检索增强生成(Retrieve Augmented Generatered):其实RAG就相当于增强prompt。

使用RAG中的流程:

知识库需要使用到向量数据库:

milvus向量数据库。

Tools工具

功能场景,在大模型与用户沟通过程中,可以在回答中添加一些信息或者收集一些信息。

也就是读取MySQL中的数据,并通过AI问答展示出来。

Tools工具原理

之前叫做Function Calling;当用户表现出预约意向时,调用对应的服务进行信息收集与预约,就需要使用到当前功能,也就是在问答中调用增删改查。

这里会用到两个注解,一个是 @Tool 注解,另一个是 @P 注解;

@Tools注解为方法注解,标注当前的方法会被Agent调用,@P注解为入参注解,标注每个入参映射的具体名称。

最后在@AiService注解中将包含@Tools和@P注解的类名进行注册;tools=类名;

这样就可以在对话中调用增删改查服务。

相关推荐
考虑考虑7 小时前
Mybatis实现批量插入
java·后端·mybatis
咖啡八杯8 小时前
GoF设计模式——中介者模式
java·后端·spring·设计模式
青石路11 小时前
记一次多JDK版本问题的排查,一坑套一坑,差点没爬上来
java
像我这样帅的人丶你还14 小时前
Java 后端详解(五):Redis 缓存
java·后端·全栈
plainGeekDev16 小时前
GreenDAO → Room
android·java·kotlin
亦暖筑序21 小时前
Java 8老系统AI Workflow实战:把一次性AI对话升级成可恢复工作流
java·后端
敲代码的彭于晏1 天前
Bean 生命周期完全图解:前端同学也能看懂的 Spring 核心机制
java·前端·后端
plainGeekDev1 天前
ButterKnife → ViewBinding
android·java·kotlin
像我这样帅的人丶你还2 天前
Java 后端详解(四):分页与搜索
java·javascript·后端
她的男孩2 天前
数据权限为什么不能只靠注解?Forge 的 Mapper 层 SQL 改写源码拆解
java·后端·架构