spring-ai 第九模型介绍-聊天记录

第九模型介绍-聊天记录

官网

大型语言模型(LLMs)是无状态的,这意味着它们不会保留之前交互的信息。当您希望在多次交互中保持上下文或状态时,这可能是一个限制。为了解决这个问题,Spring AI 提供了聊天记忆功能,使您能够存储和检索在与 LLM 的多次交互中的信息。

spring-ai网址https://docs.spring.io/spring-ai/reference/api/chat-memory.html】

核心架构分为两层

  • ChatMemory(记忆管理层)

如果您需要维护所有消息交换的完整记录,您应该考虑使用其他方法,例如依赖于Spring Data以高效地存储和检索完整的聊天历史记录
Spring AI自动配置一个ChatMemory bean,您可以在应用程序中直接使用。默认情况下,它使用内存中的仓库来存储消息

策略类型 实现类 描述
消息窗口 MessageWindowChatMemory 维护一个固定大小的消息窗口,当消息数超过设定值(默认为20)时,自动移除最旧的消息。
摘要记忆 ConversationSummaryChatMemory 对超过Token限制的历史对话进行摘要,将摘要作为后续对话的上下文,节省Token用量。
时间窗口 需自定义 根据时间戳,只保留最近一段时间内的消息作为上下文。
  • ChatMemoryRepository(存储层)

存储层负责将消息存储在持久化存储中,例如数据库或文件系统。

Spring AI 提供了以下几种开箱即用的实现:

  • InMemoryChatMemoryRepository:
    • 默认实现,消息存储在内存中,适合开发或测试,重启即丢失。
  • JdbcChatMemoryRepository:
    • 用于关系型数据库持久化。官方支持 MySQL、PostgreSQL、SQL Server、HSQLDB 等

关键差异:ChatMemory 与 ChatHistory

在使用 Spring AI 的记忆功能时,理解这两个概念的区别至关重要:

  • ChatMemory:

专为维护当前对话的上下文感知而设计,用于提升模型回答质量。

  • ChatHistory:

指代完整的、原始的对话记录。官方文档明确指出,ChatMemory 不适合存储完整历史,如需保存所有记录,应考虑使用 Spring Data 等其他方案。

基于内存存储进行演示

源码示例

https://gitee.com/kcnf_open/spring-ai-sample/tree/master/spring-ai/spring-ai-sample08

  • yaml配置

    In application.yml

    spring:
    ai:
    zhipuai:
    api-key: ${ZHIPUAI_API_KEY}
    chat:
    options:
    model: glm-4v-flash
    datasource:
    url: jdbc:h2:file:./data/chat_memory
    username: sa
    password:
    driver-class-name: org.h2.Driver
    h2:
    console:
    enabled: true
    path: /h2-console
    sql:
    init:
    mode: always
    schema-locations: classpath:schema.sql

  • 测试代码

http://127.0.0.1:8082/index.html

  • 测试结果
数据库查询
  • 本地数据位置

  • 可视化客户端查询

http://localhost:8082/h2-console

复制代码
登录信息:
JDBC URL: jdbc:h2:file:./data/chat_memory
Username: sa
Password: (留空,不填)
  • 查询结果

    SELECT * FROM SPRING_AI_CHAT_MEMORY;

相关推荐
AI360labs_atyun4 分钟前
腾讯推出电子牛马Marvis,好用吗?
人工智能·科技·ai
Dfreedom.5 分钟前
Windows、虚拟机、开发板组网通信原理及调试通联步骤
人工智能·windows·部署·边缘计算·开发板·模型加速
3DVisionary8 分钟前
蓝光三维扫描:医疗制造的精度焦虑怎么解
人工智能·算法·制造·蓝光三维扫描·医疗制造·三维检测·义齿检测
Are_You_Okkk_9 分钟前
基于MonkeyCode解析AI研发新模式,根治开发低效痛点
大数据·人工智能·开源·ai编程
好评笔记17 分钟前
机器学习面试八股——常用损失函数
人工智能·深度学习·算法·机器学习·校招
weixin_4684668518 分钟前
全局与局部注意力机制新手实战指南
人工智能·python·深度学习·算法·自然语言处理·transformer·注意力机制
weixin_4684668531 分钟前
工业相机成像原理新手入门指南
人工智能·自动化·机器视觉·工业相机·光学·光学系统·成像原理
回眸&啤酒鸭35 分钟前
【回眸】CSDN新增功能测评——AI数字营销之内容创作
人工智能
小糖学代码38 分钟前
LLM系列:环境搭建:5.Python-dotenv 环境变量管理
人工智能·python·深度学习·神经网络
云安全助手43 分钟前
2026年企业级Claude中转服务深度评测:安全、稳定与速度的终极答案
人工智能·安全·claude·ai大模型