天玑学堂Agent面试总结(一)「持续更新」

这里是苦瓜大王,一个极度焦虑但还在坚持输出的Java后端学习者

🐋 希望大家多多支持,我们一起进步

🌲如果文章对你有帮助的话

欢迎 :评论 💬点赞👍🏻 收藏 📂加关注❤️

━(`∀´)ノ亻!
「长风破浪会有时,直挂云帆济沧海

文章目录

    • [**1. 聊一聊你项目中的AI模块**](#1. 聊一聊你项目中的AI模块)
    • [**2. 你项目中的AI怎么训练的,要什么条件(硬件)?**](#2. 你项目中的AI怎么训练的,要什么条件(硬件)?)
    • [**3. 最新那个 Spring AI 框架你知道吗?**](#3. 最新那个 Spring AI 框架你知道吗?)
    • [**4. 你这个AI客服功能里涉及的RAG技术是什么?具体怎么实现?**](#4. 你这个AI客服功能里涉及的RAG技术是什么?具体怎么实现?)
    • [**5. AI客服功能里,怎么调用的百度云千帆大模型**](#5. AI客服功能里,怎么调用的百度云千帆大模型)
    • [**6. 项目为什么会接这个AI客服机器人?**](#6. 项目为什么会接这个AI客服机器人?)
    • [**7. AI部署是哪个模型。**](#7. AI部署是哪个模型。)
    • [**8. 你给我讲一下这里的AI分析功能是如何实现的。**](#8. 你给我讲一下这里的AI分析功能是如何实现的。)
    • [**9. 讲下AIGC的客服的相关业务**](#9. 讲下AIGC的客服的相关业务)
    • [**10. AIGC智能客服回答的准确率怎么改进的?**](#10. AIGC智能客服回答的准确率怎么改进的?)
    • 「持续更新,建议关注」......

1. 聊一聊你项目中的AI模块

参考答案:

我项目中的AI模块是我负责的,我们做的是一个AI智能助手,基本的技术框架是使用SpringAI来实现,对接的大模型是阿里的千问max,我们是基于ES来实现RAG知识库的,将系统中的业务数据( 比如:课程数据)通过向量化存储到ES中,在发起大模型请求前,先查询ES向量库,查询到数据后,一起发给大模型进行处理,再和其他业务系统对接中,我们使用的Tool Calling方式来实现,在自定义的Tool中通过Feign来调用其他微服务的接口来获取数据。

对于对话管理,我们是采用Redis + Mysql的方式,Redis中存储的具体的对话内容数据,Mysql中存储的是对话列表数据(没有内容,只要标题、时间等)。

在项目中,我们还引入了MCP,将一些通用的服务封装成MCP服务,这样再其他的AI中就可以直接使用了,提供了服务的复用性。


2. 你项目中的AI怎么训练的,要什么条件(硬件)?

参考答案:

我们项目中并没有做大模型微调,我们是采用RAG的方式来实现扩充大模型的认知的。

当然,我对大模型的训练也是有一点了解的:

训练流程包括数据清洗、模型选择、超参数调优、验证与部署。硬件方面,主要依赖[具体硬件,如NVIDIA A100 GPU集群],使用分布式训练框架[如Horovod、Distributed TensorFlow]加速。数据存储采用[存储方案,如HDFS、云存储],训练环境基于[云平台,如AWS、阿里云]或本地集群。


3. 最新那个 Spring AI 框架你知道吗?

参考答案:

Spring AI 是 Spring 家族推出的 AI 集成框架,旨在简化机器学习模型与 Spring Boot 应用的集成。它提供统一的 API 管理、模型部署、数据流水线等功能,支持快速构建 AI 服务。

Spring AI提供的功能还是比较多的,比如说:RAG、Tool、ChatMemory等,基本能够满足与大模型对接的各种场景。并且还提供了MCP的客户端与服务端的实现,可以快速的集成MCP服务。


4. 你这个AI客服功能里涉及的RAG技术是什么?具体怎么实现?

参考答案:

RAG(Retrieval-Augmented Generation)是一种结合检索和生成的技术。我的实现步骤如下:

  1. 知识库构建:将文档分段并用向量化工具(如Sentence-BERT)生成向量,存储到向量数据库(如FAISS、Milvus),我们用的是ES。
  2. 用户查询处理:输入问题后,先通过检索模块从知识库中找出Top-K相关段落。
  3. 生成回答:将检索结果与原始问题拼接,输入到大模型(如Qwen)中生成最终回答。
  4. 结果优化:通过后处理(如去重、置信度过滤)提升准确性。

5. AI客服功能里,怎么调用的百度云千帆大模型

参考答案:

通过百度千帆的API接口调用大模型:

  1. 注册并获取API密钥。
  2. 在代码中集成SDK(如Python的requests库),构造请求参数(如prompt、温度、最大长度)。
  3. 处理异步响应,将结果返回给用户。
  4. 通过限流和缓存机制优化调用效率,避免API超频。

6. 项目为什么会接这个AI客服机器人?

参考答案:

主要基于以下需求:

  • 成本优化:24/7自动响应,减少人工客服压力。
  • 效率提升:秒级响应,处理标准化问题(如订单查询、常见问题)。
  • 用户体验:通过自然语言交互提升用户满意度。
  • 数据价值:积累用户对话数据,反哺模型训练。

7. AI部署是哪个模型。

参考答案:

我们用的是阿里云百炼平台的千问max模型,也对比很多的模型,比如:Deepseek R1、gpt-4.1、千问plus等,综合比测试下来,千问max模型能够满足我们的需求。


8. 你给我讲一下这里的AI分析功能是如何实现的。

参考答案:

AI分析功能分为三层:

  1. 数据层:从数据库或API获取结构化数据(如用户行为日志)。
  2. 模型层:使用[具体模型,如Prophet、LSTM]进行预测,或通过NLP模型(如BERT)进行情感分析。
  3. 可视化层 :通过图表工具(如ECharts、Tableau)展示结果。
    关键点在于数据清洗和特征工程,确保输入数据的准确性和模型的鲁棒性。

9. 讲下AIGC的客服的相关业务

参考答案:

AIGC(AI Generated Content)客服的核心业务包括:

  • 智能问答:处理用户咨询(如产品信息、故障排查)。
  • 工单分类:自动将用户问题分派给对应部门。
  • 情感分析:识别用户情绪,触发人工介入阈值。
  • 内容生成 :自动生成回复模板或营销文案。
    业务价值在于降低人力成本,提升服务覆盖范围。

10. AIGC智能客服回答的准确率怎么改进的?

参考答案:

改进方法包括:

  1. 数据增强:引入更多标注数据,覆盖长尾场景。
  2. 模型微调(Fine-tuning):在行业数据上对预训练模型进行适配。
  3. 反馈闭环:收集用户纠错反馈,实时更新知识库。
  4. 多模型融合:结合多个模型的输出,通过投票或加权提升鲁棒性。
  5. 规则引擎:对特定问题设置规则优先级(如高风险问题强制人工审核)。

「持续更新,建议关注」...

关注苦瓜小生,后续会持续更新面试题总结哦!

🌲如果文章对你有帮助的话

欢迎 :评论 💬点赞👍🏻 收藏 📂加关注❤️

━(`∀´)ノ亻!

相关推荐
悟空瞎说1 天前
前端性能优化进阶指南:从底层原理到工程化闭环
面试·性能优化
AI人工智能+电脑小能手1 天前
【大白话说Java面试题】【Java基础篇】第9题:HashMap根据key查询元素的时间复杂度是多少
java·开发语言·数据结构·后端·面试·哈希算法·哈希表
2501_913061341 天前
网络原理知识(6)
java·网络·网络协议·面试
knight_9___1 天前
RAG面试篇8
人工智能·python·面试·agent·rag
河阿里1 天前
Java八股:面试高频50
java·面试
米粒11 天前
力扣算法刷题 Day 52
算法·leetcode·职场和发展
人道领域1 天前
【LeetCode刷题日记】225.用队列实现栈--三招实现栈操作(多种思维)
java·开发语言·算法·leetcode·面试
浅念-1 天前
LeetCode 模拟算法:用「还原过程」搞定编程题的入门钥匙
开发语言·c++·学习·算法·leetcode·职场和发展·模拟
阿Y加油吧1 天前
算法二刷复盘|旋转排序数组二分双杀(LeetCode 33 & 153)
算法·leetcode·职场和发展