天玑学堂Agent面试总结（一）「持续更新」

这里是苦瓜大王，一个极度焦虑但还在坚持输出的Java后端学习者

🐋 希望大家多多支持，我们一起进步

🌲如果文章对你有帮助的话

欢迎：评论 💬点赞👍🏻 收藏 📂加关注❤️

━(｀∀´)ノ亻!
「长风破浪会有时，直挂云帆济沧海」

文章目录

- [**1. 聊一聊你项目中的AI模块**](#1. 聊一聊你项目中的AI模块)
- [**2. 你项目中的AI怎么训练的，要什么条件（硬件）？**](#2. 你项目中的AI怎么训练的，要什么条件（硬件）？)
- [**3. 最新那个 Spring AI 框架你知道吗？**](#3. 最新那个 Spring AI 框架你知道吗？)
- [**4. 你这个AI客服功能里涉及的RAG技术是什么？具体怎么实现？**](#4. 你这个AI客服功能里涉及的RAG技术是什么？具体怎么实现？)
- [**5. AI客服功能里，怎么调用的百度云千帆大模型**](#5. AI客服功能里，怎么调用的百度云千帆大模型)
- [**6. 项目为什么会接这个AI客服机器人？**](#6. 项目为什么会接这个AI客服机器人？)
- [**7. AI部署是哪个模型。**](#7. AI部署是哪个模型。)
- [**8. 你给我讲一下这里的AI分析功能是如何实现的。**](#8. 你给我讲一下这里的AI分析功能是如何实现的。)
- [**9. 讲下AIGC的客服的相关业务**](#9. 讲下AIGC的客服的相关业务)
- [**10. AIGC智能客服回答的准确率怎么改进的？**](#10. AIGC智能客服回答的准确率怎么改进的？)
- 「持续更新，建议关注」......

1. 聊一聊你项目中的AI模块

参考答案：

我项目中的AI模块是我负责的，我们做的是一个AI智能助手，基本的技术框架是使用SpringAI来实现，对接的大模型是阿里的千问max，我们是基于ES来实现RAG知识库的，将系统中的业务数据（比如：课程数据）通过向量化存储到ES中，在发起大模型请求前，先查询ES向量库，查询到数据后，一起发给大模型进行处理，再和其他业务系统对接中，我们使用的Tool Calling方式来实现，在自定义的Tool中通过Feign来调用其他微服务的接口来获取数据。

对于对话管理，我们是采用Redis + Mysql的方式，Redis中存储的具体的对话内容数据，Mysql中存储的是对话列表数据（没有内容，只要标题、时间等）。

在项目中，我们还引入了MCP，将一些通用的服务封装成MCP服务，这样再其他的AI中就可以直接使用了，提供了服务的复用性。

2. 你项目中的AI怎么训练的，要什么条件（硬件）？

参考答案：

我们项目中并没有做大模型微调，我们是采用RAG的方式来实现扩充大模型的认知的。

当然，我对大模型的训练也是有一点了解的：

训练流程包括数据清洗、模型选择、超参数调优、验证与部署。硬件方面，主要依赖 $具体硬件，如NVIDIA A100 GPU集群$ ，使用分布式训练框架 $如Horovod、Distributed TensorFlow$ 加速。数据存储采用 $存储方案，如HDFS、云存储$ ，训练环境基于 $云平台，如AWS、阿里云$ 或本地集群。

3. 最新那个 Spring AI 框架你知道吗？

参考答案：

Spring AI 是 Spring 家族推出的 AI 集成框架，旨在简化机器学习模型与 Spring Boot 应用的集成。它提供统一的 API 管理、模型部署、数据流水线等功能，支持快速构建 AI 服务。

Spring AI提供的功能还是比较多的，比如说：RAG、Tool、ChatMemory等，基本能够满足与大模型对接的各种场景。并且还提供了MCP的客户端与服务端的实现，可以快速的集成MCP服务。

4. 你这个AI客服功能里涉及的RAG技术是什么？具体怎么实现？

参考答案：

RAG（Retrieval-Augmented Generation）是一种结合检索和生成的技术。我的实现步骤如下：

知识库构建：将文档分段并用向量化工具（如Sentence-BERT）生成向量，存储到向量数据库（如FAISS、Milvus），我们用的是ES。
用户查询处理：输入问题后，先通过检索模块从知识库中找出Top-K相关段落。
生成回答：将检索结果与原始问题拼接，输入到大模型（如Qwen）中生成最终回答。
结果优化：通过后处理（如去重、置信度过滤）提升准确性。

5. AI客服功能里，怎么调用的百度云千帆大模型

参考答案：

通过百度千帆的API接口调用大模型：

注册并获取API密钥。
在代码中集成SDK（如Python的requests库），构造请求参数（如prompt、温度、最大长度）。
处理异步响应，将结果返回给用户。
通过限流和缓存机制优化调用效率，避免API超频。

6. 项目为什么会接这个AI客服机器人？

参考答案：

主要基于以下需求：

成本优化：24/7自动响应，减少人工客服压力。
效率提升：秒级响应，处理标准化问题（如订单查询、常见问题）。
用户体验：通过自然语言交互提升用户满意度。
数据价值：积累用户对话数据，反哺模型训练。

7. AI部署是哪个模型。

参考答案：

我们用的是阿里云百炼平台的千问max模型，也对比很多的模型，比如：Deepseek R1、gpt-4.1、千问plus等，综合比测试下来，千问max模型能够满足我们的需求。

8. 你给我讲一下这里的AI分析功能是如何实现的。

参考答案：

AI分析功能分为三层：

数据层：从数据库或API获取结构化数据（如用户行为日志）。
模型层：使用 $具体模型，如Prophet、LSTM$ 进行预测，或通过NLP模型（如BERT）进行情感分析。
可视化层 ：通过图表工具（如ECharts、Tableau）展示结果。
关键点在于数据清洗和特征工程，确保输入数据的准确性和模型的鲁棒性。

9. 讲下AIGC的客服的相关业务

参考答案：

AIGC（AI Generated Content）客服的核心业务包括：

智能问答：处理用户咨询（如产品信息、故障排查）。
工单分类：自动将用户问题分派给对应部门。
情感分析：识别用户情绪，触发人工介入阈值。
内容生成 ：自动生成回复模板或营销文案。
业务价值在于降低人力成本，提升服务覆盖范围。

10. AIGC智能客服回答的准确率怎么改进的？

参考答案：

改进方法包括：

数据增强：引入更多标注数据，覆盖长尾场景。
模型微调（Fine-tuning）：在行业数据上对预训练模型进行适配。
反馈闭环：收集用户纠错反馈，实时更新知识库。
多模型融合：结合多个模型的输出，通过投票或加权提升鲁棒性。
规则引擎：对特定问题设置规则优先级（如高风险问题强制人工审核）。

「持续更新，建议关注」...

关注苦瓜小生，后续会持续更新面试题总结哦！

🌲如果文章对你有帮助的话

欢迎：评论 💬点赞👍🏻 收藏 📂加关注❤️

━(｀∀´)ノ亻!