三种AI人机交互系统的记忆模块对比:小智、OPEN-LLM-VTUBER和MaiBot

MaiBot 的记忆和情感系统

https://github.com/MaiM-with-u/MaiBot

记忆系统

MaiBot 拥有最复杂和完整的记忆系统:

海马体记忆系统 (Hippocampus)

  • 基于图结构的记忆存储,使用 实现
  • 支持记忆构建、遗忘、整合三个核心功能
  • 记忆检索支持多层深度搜索(1-3层),可获取直接和间接相关记忆
  • 记忆压缩和采样机制,控制记忆质量和数量

工作记忆系统

  • 短期工作记忆处理器,用于专注聊天场景
  • 支持记忆激活度管理和动态调度

记忆配置参数

  • 记忆构建间隔、遗忘时间、压缩率等可配置
  • 支持记忆禁用词列表,过滤不需要记忆的内容

情感系统

MaiBot 具有先进的情感模型:

二维情感模型

  • 基于愉悦度(valence)和唤醒度(arousal)的二维情感空间
  • 支持19种具体情感状态映射(如开心、愤怒、悲伤等)
  • 情感状态会影响打字速度和回复行为

情感动态管理

  • 情感衰减机制,情感会随时间自然衰减
  • 情感历史追踪,支持情感变化趋势分析
  • 情感与人格系统集成,影响关系管理

Open-LLM-VTuber 的记忆和情感系统

https://github.com/Open-LLM-VTuber/Open-LLM-VTuber

记忆系统

Open-LLM-VTuber 的记忆系统相对简单:

基础记忆代理 (BasicMemoryAgent)

  • 使用简单的列表结构存储对话历史
  • 支持从聊天历史加载记忆
  • 群聊中为每个成员维护独立的记忆索引
  • 长期记忆功能暂时下线,但保留聊天记录持久化

情感系统

Open-LLM-VTuber 的情感系统主要用于Live2D表情控制:

Live2D情感映射

  • 通过 实现情感表达
  • 支持从文本中提取情感关键词
  • 将情感映射到Live2D模型的表情动作
  • 可配置的情感映射表,支持自定义表情控制

xiaozhi-esp32-server 的记忆和情感系统

https://github.com/xinnan-tech/xiaozhi-esp32-server

记忆系统

xiaozhi-esp32-server 提供了模块化的记忆解决方案:

多种记忆提供者

  • mem0ai:基于外部API的记忆服务
  • mem_local_short:本地短期记忆实现
  • nomem:无记忆模式

本地记忆特性

  • "时空记忆编织者"概念,支持情感强度评估
  • 记忆保存到本地文件,支持持久化
  • 可为记忆总结配置独立的LLM模型

情感系统

xiaozhi-esp32-server 的情感系统注重实用性:

情感分析功能

  • analyze_emotion 函数支持中英文情感关键词识别
  • 返回对应的emoji表情名称
  • 支持情感优先级排序

TTS情感集成

  • TTS服务支持情感参数设置
  • 对话回复考虑角色情感和态度
  • 与语音合成系统深度集成

总结对比

项目 记忆系统复杂度 情感系统特点 主要应用场景
MaiBot 最复杂 二维情感模型,动态管理 QQ群聊智能体
Open-LLM-VTuber 简单 Live2D表情映射 虚拟主播互动
xiaozhi-esp32-server 中等 实用型情感分析 智能硬件后端

MaiBot 的系统最为完整和先进,适合需要长期交互的场景;Open-LLM-VTuber 专注于视觉表现;xiaozhi-esp32-server 则提供了灵活的模块化选择,适合不同硬件环境的需求。