Spring Boot 3+Spring AI 打造旅游智能体!集成阿里云通义千问,多轮对话 + 搜索 + PDF 生成撑全流程

项目介绍

随着人工智能技术的发展,特别是大型语言模型(LLM)的出现,为构建智能对话系统提供了新的可能。然而,单纯依靠LLM存在知识时效性、工具使用能力和上下文管理等问题。本项目旨在解决这些痛点,构建一个能够自主思考、规划和行动的智能体系统,为旅游领域提供全方位的智能服务。本项目是一个面向旅游领域的智能助手系统,通过整合大型语言模型(如阿里云通义千问)、知识检索增强、工具调用和多轮对话管理,为用户提供沉浸式的旅游规划和咨询体验。系统不仅能够回答旅游相关问题,还能主动调用各种工具(如网页搜索、PDF生成、文件操作等)来完成复杂任务,实现真正的智能代理功能。

项目亮点

  1. 智能体架构

通过抽象基础代理类和实现ReAct模式,构建了一个能够自主思考和行动的智能体系统。

  1. 工具调用系统的灵活设计

工具调用系统采用了统一的注册和调用机制,每个工具都实现了标准接口,并通过ToolRegistration进行统一管理。

  1. 高性能的RAG实现

在RAG系统设计中,我采用了PostgreSQL+pgvector作为向量数据库,相比纯内存向量数据库,这种方案在大规模数据集上表现更加稳定,且支持持久化存储。

  1. 流式响应机制

基于SSE(Server-Sent Events)的流式响应机制,使得用户可以实时看到智能体的思考和行动过程,而不需要等待整个任务完成。

系统架构设计

采用了模块化、分层的架构设计,确保系统的可扩展性和可维护性。

API层

负责处理HTTP请求,提供RESTful API接口

服务层

实现业务逻辑,协调各组件工作

智能体层

核心AI代理层,实现思考-行动循环

大语言模型

提供自然语言理解和生成能力

工具调用

扩展智能体能力的各种工具

知识检索增强

通过向量数据库增强模型回答质量

会话记忆

管理多轮对话上下文

技术栈

后端技术

Spring Boot 3.5.0、Spring AI 1.0.0、

阿里云通义千问 (Qwen-Plus)、PostgreSQL

Pgvector、Redis、MyBatis-Plus 3.5.12

Knife4j 4.5.0 (基于OpenAPI 3)、

Hutool 5.8.37、Lombok 1.18.38

iText 9.1.0、Jsoup 1.19.1

前端技术

Vue.js/React、

Element-Plus/Ant Design

Axios、Pinia/Redux

核心功能

后端

  1. 智能体系统 (Agent)

智能体是系统的核心,采用了ReAct(Reasoning and Acting)模式,通过"思考-行动"的循环来解决复杂问题。

  1. 工具调用系统 (Tools)

工具调用系统扩展了智能体的能力边界,使其能够与外部世界交互。

  1. RAG知识增强系统 (RAG)

RAG系统通过检索相关知识来增强模型回答,特别适合处理专业领域问题。

向量存储:使用PostgreSQL+pgvector存储文档向量

文档处理:支持多种格式文档的处理和分块

检索器:基于语义相似度检索相关文档片段

嵌入模型:将文本转换为向量表示

  1. 对话管理系统

会话状态管理:跟踪和维护对话状态

上下文记忆:使用Redis存储短期记忆

多轮对话支持:维护连贯的对话体验

  1. API接口系统

AgentController:智能体交互接口

AppController:应用核心功能接口

RagController:知识检索相关接口

前端

AI 聊天界面

通过响应式聊天界面与 AI 智能体交互

知识库管理

查看和管理 AI 使用的知识

设置与配置

自定义 AI 智能体的行为

用户认证

安全的登录系统

安装部署

  1. 后端安装

环境要求

JDK 21+、Maven 3.8+、Redis 6+

PostgreSQL 14+(已安装pgvector扩展)

克隆仓库

复制代码
git clone ai-agent.gitcd ai-agent

配置环境变量

创建 .env 文件并配置以下环境变量:​​​​​​​

复制代码
AI_DASHSCOPE_API_KEY=your_dashscope_api_keySEARCH_API_KEY=your_search_api_key

编译项目

复制代码
mvn clean package

运行应用

复制代码
java -jar target/ai-agent-0.0.1-SNAPSHOT.jar

2. 前端安装

复制代码
npm install

开发服务器

复制代码
npm run dev

生产构建

复制代码
npm run build

UI展示

相关推荐
一切皆是因缘际会6 小时前
从概率拟合到内生心智:2026 下一代 AI 架构演进与落地实践
人工智能·深度学习·算法·架构
科研前沿6 小时前
镜像视界 CameraGraph™+多智能体:构建自感知自决策的全域空间认知网络技术方案
大数据·运维·人工智能·数码相机·计算机视觉
爱学习的张大6 小时前
具身智能论文问答(2):Diffusion Policy
人工智能
AI科技星6 小时前
全域数学·72分册·射影原本 无穷维射影几何卷细化子目录【乖乖数学】
人工智能·线性代数·算法·机器学习·数学建模·数据挖掘·量子计算
Chef_Chen6 小时前
论文解读:MemOS首次把记忆变成大模型的一等公民资源,Scaling Law迎来第三条曲线
人工智能·agent·memory
风落无尘6 小时前
《智能重生:从垃圾堆到AI工程师》——第四章 变化的艺术
人工智能·线性代数·算法
晚风_END6 小时前
Linux|操作系统|最新版openzfs编译记录
linux·运维·服务器·数据库·spring·中间件·个人开发
发哥来了6 小时前
AI视频生成模型选型指南:五大核心维度对比评测
大数据·人工智能·机器学习·ai·aigc
发哥来了7 小时前
AI驱动生产线的实际落地:一个东莞厂商的技术选型实录
大数据·人工智能·机器学习·ai·aigc
AC赳赳老秦7 小时前
知识产权辅助:用 OpenClaw 批量生成专利交底书 / 软著申请材料,自动校验格式与内容合规性
java·人工智能·python·算法·elasticsearch·deepseek·openclaw