天玑学堂Agent面试总结(一)「持续更新」

这里是苦瓜大王,一个极度焦虑但还在坚持输出的Java后端学习者

🐋 希望大家多多支持,我们一起进步

🌲如果文章对你有帮助的话

欢迎 :评论 💬点赞👍🏻 收藏 📂加关注❤️

━(`∀´)ノ亻!
「长风破浪会有时,直挂云帆济沧海

文章目录

    • [**1. 聊一聊你项目中的AI模块**](#1. 聊一聊你项目中的AI模块)
    • [**2. 你项目中的AI怎么训练的,要什么条件(硬件)?**](#2. 你项目中的AI怎么训练的,要什么条件(硬件)?)
    • [**3. 最新那个 Spring AI 框架你知道吗?**](#3. 最新那个 Spring AI 框架你知道吗?)
    • [**4. 你这个AI客服功能里涉及的RAG技术是什么?具体怎么实现?**](#4. 你这个AI客服功能里涉及的RAG技术是什么?具体怎么实现?)
    • [**5. AI客服功能里,怎么调用的百度云千帆大模型**](#5. AI客服功能里,怎么调用的百度云千帆大模型)
    • [**6. 项目为什么会接这个AI客服机器人?**](#6. 项目为什么会接这个AI客服机器人?)
    • [**7. AI部署是哪个模型。**](#7. AI部署是哪个模型。)
    • [**8. 你给我讲一下这里的AI分析功能是如何实现的。**](#8. 你给我讲一下这里的AI分析功能是如何实现的。)
    • [**9. 讲下AIGC的客服的相关业务**](#9. 讲下AIGC的客服的相关业务)
    • [**10. AIGC智能客服回答的准确率怎么改进的?**](#10. AIGC智能客服回答的准确率怎么改进的?)
    • 「持续更新,建议关注」......

1. 聊一聊你项目中的AI模块

参考答案:

我项目中的AI模块是我负责的,我们做的是一个AI智能助手,基本的技术框架是使用SpringAI来实现,对接的大模型是阿里的千问max,我们是基于ES来实现RAG知识库的,将系统中的业务数据( 比如:课程数据)通过向量化存储到ES中,在发起大模型请求前,先查询ES向量库,查询到数据后,一起发给大模型进行处理,再和其他业务系统对接中,我们使用的Tool Calling方式来实现,在自定义的Tool中通过Feign来调用其他微服务的接口来获取数据。

对于对话管理,我们是采用Redis + Mysql的方式,Redis中存储的具体的对话内容数据,Mysql中存储的是对话列表数据(没有内容,只要标题、时间等)。

在项目中,我们还引入了MCP,将一些通用的服务封装成MCP服务,这样再其他的AI中就可以直接使用了,提供了服务的复用性。


2. 你项目中的AI怎么训练的,要什么条件(硬件)?

参考答案:

我们项目中并没有做大模型微调,我们是采用RAG的方式来实现扩充大模型的认知的。

当然,我对大模型的训练也是有一点了解的:

训练流程包括数据清洗、模型选择、超参数调优、验证与部署。硬件方面,主要依赖[具体硬件,如NVIDIA A100 GPU集群],使用分布式训练框架[如Horovod、Distributed TensorFlow]加速。数据存储采用[存储方案,如HDFS、云存储],训练环境基于[云平台,如AWS、阿里云]或本地集群。


3. 最新那个 Spring AI 框架你知道吗?

参考答案:

Spring AI 是 Spring 家族推出的 AI 集成框架,旨在简化机器学习模型与 Spring Boot 应用的集成。它提供统一的 API 管理、模型部署、数据流水线等功能,支持快速构建 AI 服务。

Spring AI提供的功能还是比较多的,比如说:RAG、Tool、ChatMemory等,基本能够满足与大模型对接的各种场景。并且还提供了MCP的客户端与服务端的实现,可以快速的集成MCP服务。


4. 你这个AI客服功能里涉及的RAG技术是什么?具体怎么实现?

参考答案:

RAG(Retrieval-Augmented Generation)是一种结合检索和生成的技术。我的实现步骤如下:

  1. 知识库构建:将文档分段并用向量化工具(如Sentence-BERT)生成向量,存储到向量数据库(如FAISS、Milvus),我们用的是ES。
  2. 用户查询处理:输入问题后,先通过检索模块从知识库中找出Top-K相关段落。
  3. 生成回答:将检索结果与原始问题拼接,输入到大模型(如Qwen)中生成最终回答。
  4. 结果优化:通过后处理(如去重、置信度过滤)提升准确性。

5. AI客服功能里,怎么调用的百度云千帆大模型

参考答案:

通过百度千帆的API接口调用大模型:

  1. 注册并获取API密钥。
  2. 在代码中集成SDK(如Python的requests库),构造请求参数(如prompt、温度、最大长度)。
  3. 处理异步响应,将结果返回给用户。
  4. 通过限流和缓存机制优化调用效率,避免API超频。

6. 项目为什么会接这个AI客服机器人?

参考答案:

主要基于以下需求:

  • 成本优化:24/7自动响应,减少人工客服压力。
  • 效率提升:秒级响应,处理标准化问题(如订单查询、常见问题)。
  • 用户体验:通过自然语言交互提升用户满意度。
  • 数据价值:积累用户对话数据,反哺模型训练。

7. AI部署是哪个模型。

参考答案:

我们用的是阿里云百炼平台的千问max模型,也对比很多的模型,比如:Deepseek R1、gpt-4.1、千问plus等,综合比测试下来,千问max模型能够满足我们的需求。


8. 你给我讲一下这里的AI分析功能是如何实现的。

参考答案:

AI分析功能分为三层:

  1. 数据层:从数据库或API获取结构化数据(如用户行为日志)。
  2. 模型层:使用[具体模型,如Prophet、LSTM]进行预测,或通过NLP模型(如BERT)进行情感分析。
  3. 可视化层 :通过图表工具(如ECharts、Tableau)展示结果。
    关键点在于数据清洗和特征工程,确保输入数据的准确性和模型的鲁棒性。

9. 讲下AIGC的客服的相关业务

参考答案:

AIGC(AI Generated Content)客服的核心业务包括:

  • 智能问答:处理用户咨询(如产品信息、故障排查)。
  • 工单分类:自动将用户问题分派给对应部门。
  • 情感分析:识别用户情绪,触发人工介入阈值。
  • 内容生成 :自动生成回复模板或营销文案。
    业务价值在于降低人力成本,提升服务覆盖范围。

10. AIGC智能客服回答的准确率怎么改进的?

参考答案:

改进方法包括:

  1. 数据增强:引入更多标注数据,覆盖长尾场景。
  2. 模型微调(Fine-tuning):在行业数据上对预训练模型进行适配。
  3. 反馈闭环:收集用户纠错反馈,实时更新知识库。
  4. 多模型融合:结合多个模型的输出,通过投票或加权提升鲁棒性。
  5. 规则引擎:对特定问题设置规则优先级(如高风险问题强制人工审核)。

「持续更新,建议关注」...

关注苦瓜小生,后续会持续更新面试题总结哦!

🌲如果文章对你有帮助的话

欢迎 :评论 💬点赞👍🏻 收藏 📂加关注❤️

━(`∀´)ノ亻!

相关推荐
浅念-21 小时前
递归解题指南:LeetCode经典题全解析
数据结构·算法·leetcode·职场和发展·排序算法·深度优先·递归
Mahir0821 小时前
Redis 与 MySQL 数据同步:一致性保证的完整解决方案
数据库·redis·mysql·缓存·面试·数据一致性
洛水水1 天前
【力扣100题】33.验证二叉搜索树
算法·leetcode·职场和发展
刀法如飞1 天前
Go 字符串查找的 20 种实现方式,用不同思路解决问题
算法·面试·程序员
AI_paid_community1 天前
用 Claude Code 写了一年代码,装了这 18 个 Skills 之后,我才知道自己一直在"氛围编程"
javascript·面试
Cosolar1 天前
大模型应用开发面试 • 第4期|A2A、复杂挑战与具身智能
人工智能·后端·面试
卷帘依旧1 天前
字节前端一面面经
面试
阿苟1 天前
消息队列重点详解
后端·面试
程序员清风1 天前
AI开发岗该如何准备面试?
java·后端·面试
折哥的程序人生 · 物流技术专研1 天前
《Java 100 天进阶之路》第20篇:Java初始化、构造器、对象创建的过程
java·开发语言·后端·面试