天玑学堂Agent面试总结(一)「持续更新」

这里是苦瓜大王,一个极度焦虑但还在坚持输出的Java后端学习者

🐋 希望大家多多支持,我们一起进步

🌲如果文章对你有帮助的话

欢迎 :评论 💬点赞👍🏻 收藏 📂加关注❤️

━(`∀´)ノ亻!
「长风破浪会有时,直挂云帆济沧海

文章目录

    • [**1. 聊一聊你项目中的AI模块**](#1. 聊一聊你项目中的AI模块)
    • [**2. 你项目中的AI怎么训练的,要什么条件(硬件)?**](#2. 你项目中的AI怎么训练的,要什么条件(硬件)?)
    • [**3. 最新那个 Spring AI 框架你知道吗?**](#3. 最新那个 Spring AI 框架你知道吗?)
    • [**4. 你这个AI客服功能里涉及的RAG技术是什么?具体怎么实现?**](#4. 你这个AI客服功能里涉及的RAG技术是什么?具体怎么实现?)
    • [**5. AI客服功能里,怎么调用的百度云千帆大模型**](#5. AI客服功能里,怎么调用的百度云千帆大模型)
    • [**6. 项目为什么会接这个AI客服机器人?**](#6. 项目为什么会接这个AI客服机器人?)
    • [**7. AI部署是哪个模型。**](#7. AI部署是哪个模型。)
    • [**8. 你给我讲一下这里的AI分析功能是如何实现的。**](#8. 你给我讲一下这里的AI分析功能是如何实现的。)
    • [**9. 讲下AIGC的客服的相关业务**](#9. 讲下AIGC的客服的相关业务)
    • [**10. AIGC智能客服回答的准确率怎么改进的?**](#10. AIGC智能客服回答的准确率怎么改进的?)
    • 「持续更新,建议关注」......

1. 聊一聊你项目中的AI模块

参考答案:

我项目中的AI模块是我负责的,我们做的是一个AI智能助手,基本的技术框架是使用SpringAI来实现,对接的大模型是阿里的千问max,我们是基于ES来实现RAG知识库的,将系统中的业务数据( 比如:课程数据)通过向量化存储到ES中,在发起大模型请求前,先查询ES向量库,查询到数据后,一起发给大模型进行处理,再和其他业务系统对接中,我们使用的Tool Calling方式来实现,在自定义的Tool中通过Feign来调用其他微服务的接口来获取数据。

对于对话管理,我们是采用Redis + Mysql的方式,Redis中存储的具体的对话内容数据,Mysql中存储的是对话列表数据(没有内容,只要标题、时间等)。

在项目中,我们还引入了MCP,将一些通用的服务封装成MCP服务,这样再其他的AI中就可以直接使用了,提供了服务的复用性。


2. 你项目中的AI怎么训练的,要什么条件(硬件)?

参考答案:

我们项目中并没有做大模型微调,我们是采用RAG的方式来实现扩充大模型的认知的。

当然,我对大模型的训练也是有一点了解的:

训练流程包括数据清洗、模型选择、超参数调优、验证与部署。硬件方面,主要依赖具体硬件,如NVIDIA A100 GPU集群,使用分布式训练框架如Horovod、Distributed TensorFlow加速。数据存储采用存储方案,如HDFS、云存储,训练环境基于云平台,如AWS、阿里云或本地集群。


3. 最新那个 Spring AI 框架你知道吗?

参考答案:

Spring AI 是 Spring 家族推出的 AI 集成框架,旨在简化机器学习模型与 Spring Boot 应用的集成。它提供统一的 API 管理、模型部署、数据流水线等功能,支持快速构建 AI 服务。

Spring AI提供的功能还是比较多的,比如说:RAG、Tool、ChatMemory等,基本能够满足与大模型对接的各种场景。并且还提供了MCP的客户端与服务端的实现,可以快速的集成MCP服务。


4. 你这个AI客服功能里涉及的RAG技术是什么?具体怎么实现?

参考答案:

RAG(Retrieval-Augmented Generation)是一种结合检索和生成的技术。我的实现步骤如下:

  1. 知识库构建:将文档分段并用向量化工具(如Sentence-BERT)生成向量,存储到向量数据库(如FAISS、Milvus),我们用的是ES。
  2. 用户查询处理:输入问题后,先通过检索模块从知识库中找出Top-K相关段落。
  3. 生成回答:将检索结果与原始问题拼接,输入到大模型(如Qwen)中生成最终回答。
  4. 结果优化:通过后处理(如去重、置信度过滤)提升准确性。

5. AI客服功能里,怎么调用的百度云千帆大模型

参考答案:

通过百度千帆的API接口调用大模型:

  1. 注册并获取API密钥。
  2. 在代码中集成SDK(如Python的requests库),构造请求参数(如prompt、温度、最大长度)。
  3. 处理异步响应,将结果返回给用户。
  4. 通过限流和缓存机制优化调用效率,避免API超频。

6. 项目为什么会接这个AI客服机器人?

参考答案:

主要基于以下需求:

  • 成本优化:24/7自动响应,减少人工客服压力。
  • 效率提升:秒级响应,处理标准化问题(如订单查询、常见问题)。
  • 用户体验:通过自然语言交互提升用户满意度。
  • 数据价值:积累用户对话数据,反哺模型训练。

7. AI部署是哪个模型。

参考答案:

我们用的是阿里云百炼平台的千问max模型,也对比很多的模型,比如:Deepseek R1、gpt-4.1、千问plus等,综合比测试下来,千问max模型能够满足我们的需求。


8. 你给我讲一下这里的AI分析功能是如何实现的。

参考答案:

AI分析功能分为三层:

  1. 数据层:从数据库或API获取结构化数据(如用户行为日志)。
  2. 模型层:使用具体模型,如Prophet、LSTM进行预测,或通过NLP模型(如BERT)进行情感分析。
  3. 可视化层 :通过图表工具(如ECharts、Tableau)展示结果。
    关键点在于数据清洗和特征工程,确保输入数据的准确性和模型的鲁棒性。

9. 讲下AIGC的客服的相关业务

参考答案:

AIGC(AI Generated Content)客服的核心业务包括:

  • 智能问答:处理用户咨询(如产品信息、故障排查)。
  • 工单分类:自动将用户问题分派给对应部门。
  • 情感分析:识别用户情绪,触发人工介入阈值。
  • 内容生成 :自动生成回复模板或营销文案。
    业务价值在于降低人力成本,提升服务覆盖范围。

10. AIGC智能客服回答的准确率怎么改进的?

参考答案:

改进方法包括:

  1. 数据增强:引入更多标注数据,覆盖长尾场景。
  2. 模型微调(Fine-tuning):在行业数据上对预训练模型进行适配。
  3. 反馈闭环:收集用户纠错反馈,实时更新知识库。
  4. 多模型融合:结合多个模型的输出,通过投票或加权提升鲁棒性。
  5. 规则引擎:对特定问题设置规则优先级(如高风险问题强制人工审核)。

「持续更新,建议关注」...

关注苦瓜小生,后续会持续更新面试题总结哦!

🌲如果文章对你有帮助的话

欢迎 :评论 💬点赞👍🏻 收藏 📂加关注❤️

━(`∀´)ノ亻!

相关推荐
JAVA9651 天前
JAVA面试-并发篇 05-并发包AQS队列实现原理是什么
java·开发语言·面试
kyriewen1 天前
浏览器缓存最强攻略:强缓存、协商缓存、CDN、更新策略,一篇搞定
前端·面试·浏览器
秦明月131 天前
EPLAN部件库整理之维护篇----部件库整理收尾:做好日常维护,再也不用反复重做
经验分享·其他·职场和发展·学习方法·设计规范
JAVA社区1 天前
Java高级全套教程(十四)—— SpringData超详细实战详解
java·开发语言·spring cloud·面试·职场和发展
_Evan_Yao1 天前
如何高效刷LeetCode?大一版“从零开始”
算法·leetcode·职场和发展
ricardo19731 天前
Web Worker + 时间切片:破解主线程阻塞的两种武器
前端·面试
神奇小汤圆2 天前
业务 Agent 搭建指南:别急着重造 Agent,用知识、工具与评测跑通闭环
面试
_日拱一卒2 天前
LeetCode:78子集
数据结构·算法·leetcode·职场和发展
8Qi82 天前
LeetCode 62 & 63:不同路径 I & II(含障碍物)
java·算法·leetcode·职场和发展·动态规划
西安邮电大学2 天前
binlog/redolog/undolog三者对比
java·后端·其他·面试