抖音级短视频推荐与直播带货平台面试实战：从 Java 微服务到 RAG 智能客服全链路解析

抖音级短视频推荐与直播带货平台：从 Java 基础到 AI RAG 的系统设计面试实战

场景：某头部互联网大厂，业务方向为短视频推荐 + 直播带货电商，主技术栈为 Java、Spring 全家桶、微服务、Kafka、Redis、Elasticsearch、Kubernetes，以及最新接入的 AI RAG 智能客服与内容审核能力。

角色：

严肃的面试官（简称 面试官）

搞笑的水货程序员小Y（略懂一点、吹得很多）

第一轮：短视频推荐业务 & Java 基础与 Spring Boot 入门

业务背景：公司在做类似抖音的短视频内容社区 + UGC 平台，用户可以上传视频、点赞、评论、关注作者，并通过推荐算法获得个性化内容流。

问题 1：Java 版本与基础特性

面试官： 你简历上写着"精通 Java 8~17"，那先简单一点的问题，Java 8 和 Java 11/17 在语法和运行时特性上，有哪些你实际用过的差异？

小Y： 嗯...Java 8 主要是 Lambda、Stream，还有...呃...Optional 吧。Java 11 和 17...我印象里主要是更新了 GC 啊、性能变好了，然后...还有一些模块化？对，Jigsaw 那个我也看过文档，没怎么用，哈哈。

面试官：（点点头）那你在项目里实际用过的版本是？

小Y： 啊...我们线上其实是 Java 8...不过我本地会装个 Java 17 跑跑 Demo，看一下新特性，毕竟要拥抱新技术嘛。

面试官： 嗯，至少你没说"线上跑 17，开发用 8"。Java 8 的 Stream 在处理短视频推荐列表时，你是怎么用的？比如我们需要对一批视频进行过滤和排序。

小Y： 哦，这个我会的，我们会用 stream().filter().sorted().collect() 这种链式调用，比如过滤掉下架的视频、再按热度排序，然后返回列表。

面试官： 好，这部分还行。

问题 2：Spring Boot 与 Web 层设计

面试官： 我们短视频服务有对外的 REST 接口，比如 GET /api/v1/feed 返回推荐视频流。说说你在项目中，如何用 Spring Boot + Spring MVC 实现这样一个接口，包括控制层、参数校验和异常处理。

小Y： 呃...我们一般就是写个 @RestController，然后 @GetMapping("/feed")，里面调用 Service，Service 再调用 DAO，最后返回一个 List<VideoDto> 就行了。参数校验的话，我...有时候会加 @Valid，然后加一些 @NotNull 什么的。异常的话，我们有全局异常处理，那个...@ControllerAdvice？

面试官： 那你实际写过 @ControllerAdvice 吗？

小Y： 写过写过，我一般就复制以前项目的通用异常处理类，改一下包名和返回结构，嗯...

面试官：（略微皱眉）复制粘贴也算"写过"？好吧。那你会用 Spring WebFlux 吗？比如我们有用户实时在线人数监控，用响应式流更合适。

小Y： WebFlux 我...看过教程，知道有 Mono、Flux，我对响应式编程很感兴趣，但目前还没在真实项目里用，哈哈。

面试官： 好，至少没瞎编。

问题 3：持久化与 ORM 框架

面试官： 短视频业务中，我们有大量的视频元数据、用户信息、点赞关系等，需要做持久化。你在项目中主要用的是 Hibernate 还是 MyBatis？为什么？

小Y： 我主要是用 MyBatis，感觉它比较灵活，可以自己写 SQL，调优更方便。Hibernate 我试过，感觉...它帮我写 SQL，有时候反而不好控制。

面试官： 那 MyBatis 的 Mapper 映射是怎么写的？你们是 XML 还是注解？

小Y： 嗯...我们团队比较混搭，有 XML 的，也有注解的。比如查视频列表就是写个 <select>，里面写 SQL，返回 List<VideoPO>。

面试官： 用过 MyBatis-Plus 吗？

小Y： 啊，这个我们同事用得多，我一般...用原生 MyBatis。

面试官： 好，先不为难你。那连接池你们用的是什么？

小Y： 用的是 HikariCP，Spring Boot 默认就是这个嘛，性能挺好的。

面试官： 还可以。

问题 4：缓存与热点数据

面试官： 短视频推荐里，热点视频、用户关注列表这些都是高频访问数据，你们如何设计缓存？用的什么技术栈？

小Y： 这个我熟，我们用 Redis 做缓存，用 Spring Cache 注解，比如 @Cacheable 标在 Service 方法上，然后热点数据就会缓存起来。

面试官： 你们 Redis 是怎么部署的？哨兵还是集群？有用过 Redis Cluster 吗？

小Y： 呃...这个...我记得...好像运维那边搞了哨兵，然后...也有集群...反正我们是连一个地址就能用了，哈哈。

面试官：（看着他）也就是说你完全没关心过 Redis 部署架构？

小Y： 啊...我主要是业务开发嘛，哈哈，运维那边挺专业的。

面试官： 行，第一轮先到这里。

第二轮：直播带货电商 & 微服务、消息队列与分布式事务

业务背景：平台支持主播开直播、挂商品、用户实时下单支付，涉及库存扣减、订单创建、支付回调、营销优惠、佣金结算等复杂链路，采用微服务架构 + 消息队列进行解耦与削峰填谷。

问题 1：微服务划分与 Spring Cloud 组件

面试官： 我们直播带货电商整体采用 Spring Cloud 微服务架构。请你简单划分一下服务，并说明会用到哪些 Spring Cloud 或 Netflix OSS 组件？

小Y： 嗯...我们可以按业务拆，比如：用户服务、商品服务、订单服务、支付服务、直播服务、推荐服务之类的。Spring Cloud 组件的话，有...Eureka 做注册中心，Zuul 或 Gateway 做网关，配置中心用 Spring Cloud Config，负载均衡用 Ribbon，熔断用...Hystrix...呃，不过现在好像推荐 Resilience4j 来着。

面试官： 听起来你是背过一套标准答案。那你线上真的用 Eureka 了吗？Kubernetes 时代我们更多是用 Service + DNS 做服务发现，你了解吗？

小Y： 呃...我们线上的确是跑在 K8s 上，不过...服务发现是运维那边配的，我只知道有服务名，然后就能调通，哈哈。

面试官： 好。那你了解 Spring Cloud LoadBalancer 吗？

小Y： 呃...这个...我知道它替代 Ribbon 的，但...我...还没怎么用过。

问题 2：订单创建与消息队列（Kafka / RabbitMQ）

面试官： 在直播间高并发抢购时，我们订单服务存在巨大写压力。你会如何利用消息队列（比如 Kafka 或 RabbitMQ）来实现削峰、异步处理？

小Y： 这个我在简历写过的，我们会把用户下单请求写入 Kafka，然后订单服务从 Topic 里消费，异步去创建订单，这样前端就不用等太久，还可以限流之类的。

面试官： 具体一点。比如用户点击"下单"，请求链路是怎样的？

小Y： 嗯...前端 -> 网关 -> 订单 API -> 把消息发到 Kafka，然后返回"排队中"之类的提示，后端消费成功后再...更新订单状态，嗯...

面试官： 订单创建失败怎么办？比如库存不足，或者支付未完成？你如何保证消息不丢、不重复？

小Y： 呃...这个...一般会设置重试，然后...我们可以根据订单号做幂等，防止重复创建。消息丢的话...Kafka 本身挺可靠的...哈哈。

面试官： 那你在项目里，有真正配置过 Kafka 的 acks、retries、enable.idempotence 等参数吗？

小Y： 这个...是中间件同学配置的，我们这边就是用 Spring Kafka 默认配置，嗯...

面试官： 好。算你暂时能描述一个大概方向。

问题 3：分布式事务与库存扣减

面试官： 直播秒杀场景中，库存服务和订单服务分别是两个微服务。下单时，如何保证库存扣减与订单创建的一致性？你会选择哪种分布式事务方案？

小Y： 呃...可以用...分布式事务中间件，比如 Seata 啊，或者用 TCC 模式，Try/Confirm/Cancel，那一套。也可以用本地消息表 + 最终一致性...

面试官： 你在项目中真正落地过哪一种？

小Y： 我...主要是用本地消息表和事务消息，就是先在本地库写一条消息，然后再发到 MQ...

面试官： 你能具体描述一下"订单服务创建订单 + 发送消息 + 库存服务消费消息扣减库存"的完整流程吗？包括数据库事务边界。

小Y： 呃...订单服务在一个本地事务里，写订单表和本地消息表，然后事务提交之后，有个后台任务去扫描本地消息表，把消息发到 Kafka。库存服务消费到消息后，扣减库存。扣减失败的话，再...重试？或者人工处理...

面试官： 好，这个思路还算对。

问题 4：日志与监控（ELK、Prometheus、Grafana）

面试官： 在直播高峰时，系统容易出现各种问题。你们如何监控和排查？现在线上主要用了哪些监控和日志方案？

小Y： 我们用 ELK，把 Log4j2 的日志输出到文件，然后用 Filebeat 收集到 Elasticsearch，再在 Kibana 里查日志。监控的话，用了 Prometheus + Grafana，收集 JVM 指标、接口 QPS、错误率之类的。Spring Boot 里也有 Micrometer，可以直接导出指标。

面试官： 那你自己写过自定义的业务指标吗？比如"直播间下单成功率"？

小Y： 写过，我会用 MeterRegistry 注册一个 Counter，然后下单成功就 counter.increment()。

面试官： 这部分还不错。

问题 5：安全与风控（Spring Security、JWT、风控规则）

面试官： 电商场景还有很多安全问题，例如恶意刷单、爬虫、作弊等。你在项目中用过 Spring Security 或 OAuth2 吗？如何做登录鉴权和风控？

小Y： Spring Security 用过，我们会写一个 UserDetailsService 去加载用户，然后用 JWT 做无状态登录，用户登录成功后返回一个 Token，后续请求在 Header 里带上。风控的话...我们会看 IP、设备 ID 之类的，限制频率...

面试官： 有没有接入过第三方账号体系，比如用 Keycloak 或 OAuth2 登录？

小Y： 这个...我知道，但我们项目里还没接过，哈哈。

面试官： 好，第二轮结束。

第三轮：AI 智能客服 & RAG 搜索问答系统

业务背景：平台希望构建智能客服系统，支持用户通过自然语言咨询"订单问题、退款流程、直播活动规则、商品信息"等，采用 RAG（检索增强生成） + Agent 架构，结合公司内部文档、FAQ、订单数据，实现低幻觉的企业文档问答和复杂工作流自动处理。

问题 1：RAG 基本架构与向量数据库

面试官： 你简历里写着"熟悉 RAG、向量数据库 Milvus/Redis、Embedding 模型 OpenAI/Ollama"。请你设计一个用于订单问答的 RAG 系统架构，说明数据流和组件选型。

小Y： 嗯...RAG 的话，大致就是：先把公司文档和 FAQ 用 Embedding 模型向量化，存到 Milvus 或 Redis 之类的向量数据库里。用户提问的时候，也做 Embedding，然后在向量库里做相似度搜索，取 Top-K 文档，再交给大模型，比如 OpenAI 的 ChatGPT 或 Ollama，本地模型也行，把检索结果作为上下文，让模型生成答案。

面试官： 那订单问答中，还有与用户个人订单相关的数据，这部分你会怎么处理？

小Y： 呃...这个...可以再查我们订单服务的 API，把用户最近订单拉出来，合并到上下文里，让模型一起参考...

面试官： 你如何区分"公共知识"（比如退款政策）和"用户私有数据"（比如某个订单状态）？

小Y： 这个...嗯...可以...加一些标签？比如把订单数据放在一个单独的向量空间...或者在 Agent 里写规则，先查订单，再查文档...

面试官： 听起来你概念知道一些，但落地方案不太清晰。

问题 2：Agent、工具调用框架与复杂工作流

面试官： 我们打算用 Agentic RAG，也就是让 Agent 能够自主调用工具，比如"订单查询 API"、"退款申请 API"、"物流查询 API"等，完成复杂工作流。你会如何设计这个 Agent？用 Spring AI 或其他框架如何串起来？

小Y： 嗯...Spring AI 我听说过，它可以把 LLM 接到 Spring Boot 里。Agent 的话，可以定义一组工具，比如 HTTP 调用订单服务的 Client（用 OpenFeign 或 Retrofit），然后把工具的描述暴露给模型，让模型决定什么时候调用哪个工具...

面试官： 你会怎么避免 Agent 乱调接口？比如动不动就帮用户申请退款？

小Y： 这个...可以...加一些权限控制？比如需要用户确认...或者在工具说明里写清楚...

面试官： 这就比较模糊了。你有没有了解过"工具调用标准化"、"MCP（模型上下文协议）"之类的概念？

小Y： 呃...我在 newsletter 里看过，说是统一工具调用协议，让模型更容易调工具...还没实际尝试过。

面试官： 嗯。

问题 3：AI 幻觉与安全控制

面试官： RAG 系统一个大问题是 AI 幻觉（Hallucination）。比如用户问"我这单是不是可以延长保修一年"，模型瞎编一个"可以的"。你会如何在架构上降低幻觉风险，并保证回答可控？

小Y： 嗯...可以：

所有答案都基于检索到的文档，要求模型只能引用上下文，不允许乱编；
对模型输出做规则校验，比如涉及价格、金额、优惠时，要通过后台规则引擎确认；
还有...可以...加一些...提示工程（prompt），让模型谨慎一点？

面试官： 你提到了"提示工程"，那你知道什么是"提示模板"和"提示填充"吗？在 Spring AI 里怎么做？

小Y： 呃...我知道可以在 prompt 里写一些模板，比如"你是一个客服机器人"，然后把用户问题和文档插进去。Spring AI 里好像可以用 YAML 配置模板...我还没写过实际项目。

面试官： 也就是说，你在 AI 这块主要还停留在 Demo 级别。

小Y： 嗯...可以这么说吧，但我学习能力很强的！

面试官：（看了看时间）好，第三轮差不多。

面试结束

面试官： 今天我们聊了短视频推荐、直播带货微服务架构，以及 AI 智能客服和 RAG 系统。你在 Java 与基础业务开发方面还可以，但在微服务落地细节和 AI 工程化方面，还有不少空白。回去可以重点补一下。

小Y： 好的好的，我回去就学，我已经把你刚才说的记下来了。

面试官： 那就先这样，回去等通知吧，我们会在一周内给结果。

小Y：（小声）希望不要是"系统繁忙，请稍后再试"...

面试题详细解析（给小白看的业务 + 技术点）

下面把故事中提到的关键问题，拆成"业务场景 + 技术方案"，帮助零基础的读者建立完整的知识图谱。

一、短视频推荐业务：Java 基础 + Spring Boot + 持久化 + 缓存

1. Java 版本与特性（Java 8 / 11 / 17）

业务背景： 短视频平台的服务端需要长期稳定运行、并发高、响应快，对 JVM 性能和稳定性要求高。

核心知识点：

Java 8 ：
- Lambda 表达式：简化匿名内部类写法，用于回调、集合操作。
- Stream API：对集合进行过滤、映射、分组、排序等操作，常用于推荐列表生成。
- Optional：减少 NPE（空指针异常），提升可读性。
Java 11/17 ：
- 更好的 GC（例如 G1 的默认化，以及 ZGC、Shenandoah 等在高版本中的可选使用）。
- HTTP Client：Java 11 提供新的 java.net.http.HttpClient，可用于内部服务调用（不过在 Spring 项目里通常还是用 RestTemplate 或 WebClient）。
- 模块化系统（Jigsaw）：大型应用拆分更细，但在互联网后端实战中应用不算特别广。

总结： 面试中，重点是：你是否理解 Java 8 带来的函数式编程风格，以及在集合操作、并发处理中的实战经验。

2. Spring Boot + Spring MVC：构建 REST API

业务场景： 前端 APP 需要调用后端接口拉取推荐视频列表，接口类似：

http 复制代码

GET /api/v1/feed?userId=123&page=1&pageSize=10

技术点：

使用 @RestController + @GetMapping 暴露 REST API：

java 复制代码

@RestController
@RequestMapping("/api/v1")
public class FeedController {

    private final FeedService feedService;

    public FeedController(FeedService feedService) {
        this.feedService = feedService;
    }

    @GetMapping("/feed")
    public List<VideoDto> getFeed(@Valid FeedRequest request) {
        return feedService.getFeed(request);
    }
}

参数校验：使用 @Valid 和 javax.validation 注解，比如 @NotNull、@Min、@Max，对分页参数做约束。
全局异常处理：

java 复制代码

@ControllerAdvice
public class GlobalExceptionHandler {

    @ExceptionHandler(MethodArgumentNotValidException.class)
    @ResponseBody
    public ErrorResponse handleValidationException(MethodArgumentNotValidException ex) {
        // 构造统一返回结构
    }

    @ExceptionHandler(Exception.class)
    @ResponseBody
    public ErrorResponse handleException(Exception ex) {
        // 兜底异常
    }
}

实战建议：

不要把所有逻辑都写在 Controller；
把业务逻辑放在 Service 层、数据访问放在 Repository/DAO 层；
使用统一响应结构（如 code + message + data）。

3. MyBatis / Hibernate / JPA 与连接池 HikariCP

业务场景： 短视频元数据（标题、封面、URL、时长）、用户信息、点赞记录、关注关系等，都要存到数据库（通常是 MySQL）。

技术点：

ORM/持久化框架：
- MyBatis：你写 SQL，框架负责参数映射和结果映射。适合复杂查询和强调 SQL 控制的项目。
- Hibernate / JPA：框架根据实体类自动生成和执行 SQL，适合 CRUD 场景较多的业务。
连接池：
- Spring Boot 默认使用 HikariCP，特点是性能高、配置简单；
- 常见配置项：最大连接数、连接超时时间、空闲连接检测等。

示例： MyBatis XML 查询视频列表：

xml 复制代码

<select id="listVideos" resultType="VideoPO">
  SELECT id, title, url, cover, duration, status
  FROM video
  WHERE status = 'ONLINE'
  ORDER BY publish_time DESC
  LIMIT #{limit} OFFSET #{offset}
</select>

4. Redis 缓存与热点数据

业务场景：

热门视频列表、用户关注列表、用户基本信息在短时间内被频繁访问；
若每次都查数据库，会增加延迟和数据库压力。

技术方案：

使用 Redis 作为缓存，用 Spring Cache 或手写缓存逻辑。
简单使用示例：

java 复制代码

@Service
public class UserService {

    @Cacheable(cacheNames = "user", key = "#userId")
    public UserDto getUserById(Long userId) {
        // 实际从数据库加载
    }
}

对于热门排行榜等，可以使用 Redis 的 ZSet 存储，按播放量、点赞量排序。
部署层面：
- 小规模可用单机 + RDB/AOF 持久化；
- 生产通常使用哨兵/集群，保证高可用与扩展性。

二、直播带货电商：微服务架构 + 消息队列 + 分布式事务

1. 微服务划分与 Spring Cloud / Kubernetes 生态

业务场景：

直播带货涉及多个业务域：用户、商品、库存、订单、支付、营销、直播、推荐等。单体应用难以维护与扩展，于是拆分为微服务。

典型划分：

User Service（用户服务）
Product Service（商品服务）
Stock Service（库存服务）
Order Service（订单服务）
Payment Service（支付服务）
Live Service（直播间服务）
Promotion Service（优惠/营销）

技术选型：

Spring Cloud 组件：
- 注册中心：Eureka / Consul，或在 Kubernetes 环境下使用原生 Service + DNS。
- 配置中心：Spring Cloud Config / Nacos。
- 网关：Spring Cloud Gateway / Zuul。
- 客户端调用：OpenFeign。
- 负载均衡：Ribbon（旧）/ Spring Cloud LoadBalancer（新）。
- 熔断与限流：Resilience4j（替代 Hystrix）。
容器与编排：
- 使用 Docker 打包服务，部署到 Kubernetes；
- 使用 Jenkins / GitLab CI / GitHub Actions 实现 CI/CD。

2. 高并发下单：Kafka / RabbitMQ 削峰填谷

业务场景：

大促直播时，上万用户同时点击"立即购买"；
若直接同步写订单数据库，可能导致数据库撑爆、接口超时。

技术方案： 使用消息队列 + 异步处理。

典型链路：

用户点击"下单" -> 前端发送请求。
API 网关将请求转发到 Order API。
Order API：
- 进行基本校验（库存是否大致足够、用户是否登录等）；
- 将"下单请求"写入 Kafka Topic（如 order_create）；
- 立刻返回"排队中"或「下单请求已接收」。
Order Service 消费 order_create Topic：
- 真正写入订单表；
- 再投递"库存扣减"消息或调用库存服务。
用户可通过轮询 / WebSocket / 推送查看订单创建结果。

关键点：

生产端：
- 设置 acks=all、retries、enable.idempotence=true，提高可靠性；
消费端：
- 使用幂等策略（如订单号唯一约束），防止重复消费导致重复订单；
- 使用手动提交 offset，确保"先处理再提交"。

3. 分布式事务：库存与订单的一致性

业务场景：

下单时，需要保证：库存成功扣减，订单才能生效；
两个不同服务各自有自己的数据库，无法使用本地事务直接覆盖。

常见方案：

本地消息表 + 最终一致性（主流）：
- 在订单服务中：
  - 开启本地事务；
  - 写订单表 + 写本地消息表（状态为"待投递"）；
  - 提交事务；
- 后台任务扫描本地消息表，将消息发到 MQ，并更新消息状态；
- 库存服务消费消息，执行扣减库存；
- 若扣减失败，则记录异常并触发补偿机制（人工或自动）。
TCC（Try-Confirm-Cancel）：
- Try：预留资源（如冻结库存）；
- Confirm：确认执行（实际扣减库存）；
- Cancel：回滚（释放预留资源）；
- 适用于强一致性要求的核心交易，但实现复杂。
分布式事务中间件（如 Seata）：
- 封装分布式事务协调器，开发时像用本地事务；
- 需要评估性能与耦合度。

4. 日志、监控与链路追踪

业务场景：

直播高峰时的问题排查：某个请求变慢、某个服务异常、某个 Topic 堆积等。

技术方案：

日志：
- 使用 Log4j2 / Logback + SLF4J 统一日志接口；
- 日志集中收集到 ELK（Elasticsearch + Logstash/Filebeat + Kibana）。
指标监控：
- 使用 Micrometer 收集 JVM/业务指标，导出到 Prometheus；
- 使用 Grafana 可视化图表。
链路追踪：
- 使用 Jaeger/Zipkin，对每个请求的调用链进行追踪，识别瓶颈服务。

5. 安全与风控

业务场景：

需要登录鉴权、接口访问控制、防止恶意刷单和爬虫。

技术方案：

Spring Security + JWT ：
- 用户登录成功后，生成 JWT（含 userId、过期时间等）；
- 前端在每次请求的 Header 中携带 Authorization: Bearer <token>；
- 后端过滤器解析 JWT，进行鉴权。
风控：
- 根据 IP、设备 ID、行为频率等维度，建立规则或模型；
- 对超频请求进行限流、拦截或验证码校验。

三、AI 智能客服：RAG、Agent、向量数据库与幻觉控制

1. RAG（检索增强生成）的基本架构

业务场景：

用户问各种问题：
- 「我这单什么时候发货？」
- 「直播间活动规则是什么？」
- 「怎么申请退款？」
这些问题一部分依赖企业文档 （活动规则、政策），一部分依赖用户个人数据（订单状态）。

RAG 基本流程：

文档加载 ：
- 将公司内部文档、FAQ、客服知识库加载到系统；
- 使用文档加载器（可以是自研，也可以用工具库）。
切分与向量化 ：
- 将长文档分成小段（chunk）；
- 使用 Embedding 模型（如 OpenAI 的 text-embedding-3-large 或本地的 Ollama 模型）生成向量；
- 将向量存入向量数据库（Milvus、Chroma、Redis）。
语义检索 ：
- 用户提问 → 生成提问向量；
- 在向量库中进行相似度搜索（语义检索），得到相关文档片段。
生成答案 ：
- 将检索到的文档片段 + 用户问题打包成 Prompt；
- 调用大模型（LLM），生成最终回答。

关键术语：

向量化 / Embedding：将文本变成高维向量，用于语义相似度计算；
向量数据库：支持高维向量索引和检索，如 Milvus、Redis Vector 等；
语义检索：相似度检索，而非关键词检索；
RAG：在生成前用检索结果增强上下文。

2. Agent 与工具调用

业务场景：

用户问的是"我这单到底发货没有？快递单号是多少？"
仅靠静态文档无法回答，需要查实时订单数据。

Agentic RAG 架构：

定义工具（Tool）：
- 订单查询工具：调用 Order Service 的 API；
- 物流查询工具：调用物流服务或第三方 API；
- 退款申请工具：调用退款流程。
Agent 逻辑：
- 先根据用户问题判断是否需要调用工具；
- 若需要调用某工具，则构造工具调用参数（如订单号）；
- 工具返回结果后，再结合文档检索结果交给模型生成回答。
技术支撑：
- 使用 Spring AI、LangChain4j 等框架，将 LLM、工具调用、RAG 流程整合到 Spring Boot 中；
- 使用客户端-服务器架构，让前端通过 HTTP/WebSocket 与 Agent 服务交互。
MCP（模型上下文协议）：
- 提供一种标准化的方式，让模型与工具、数据源交互；
- 便于扩展更多工具和数据源，提高可维护性。

3. 幻觉（Hallucination）与安全控制

问题：

模型可能在没有可靠数据的情况下胡编乱造；
在电商与金融场景中，这是危险的（可能承诺不存在的优惠或补偿）。

控制手段：

检索优先：
- 所有回答必须基于检索到的文档片段；
- 若没有足够信息，明确表示"无法确定，需要人工处理"。
规则校验：
- 对涉及金额、优惠、合规等内容的回答，使用规则引擎或后端服务校验；
- 模型只负责自然语言表达，不直接决策金额。
提示工程（Prompt Engineering）：
- 在 Prompt 中明确要求模型"不编造事实"，只根据上下文回答；
- 使用模板（Prompt Template），例如：

text 复制代码

你是某电商平台的客服机器人，只能根据给定的上下文回答问题。
如果上下文中没有相关信息，请回答："当前知识库中没有该问题的答案，请联系人工客服。"

用户问题：{question}

相关文档：
{retrieved_docs}

请用简体中文回答用户问题。

访问控制：
- 对工具调用做权限控制，避免 Agent 随意触发高风险操作（例如自动退款、修改订单信息）。

四、给 Java 求职者的小结

基础扎实：Java SE（尤其是 Java 8 特性）、集合、并发、JVM 调优，是后端工程师的根基。
Spring 全家桶：Spring Boot、Spring MVC、Spring Data、Spring Security，是互联网大厂最常用的组合。
微服务与云原生：理解服务拆分、Spring Cloud、消息队列、Docker、Kubernetes 的基本使用。
缓存与 MQ：掌握 Redis、Kafka 的基本模型和常见架构模式，例如缓存击穿、削峰填谷。
监控与运维：熟悉日志采集（ELK）、指标监控（Prometheus+Grafana）、链路追踪（Jaeger/Zipkin）。
AI 与 RAG：至少要理解 RAG、向量数据库、Agent、工具调用、幻觉控制的基本概念和常见业务场景。

面试中，像小Y那样"略懂一点、吹得很多"很容易被识破。与其堆砌名词，不如扎扎实实在简历上写自己真正做过的技术方案，并能讲清楚"为什么这么设计、怎么落地、出了问题怎么排查"。

希望这篇带有故事情节的面试实战，能帮你把短视频推荐、直播带货、电商微服务和 AI 智能客服这些热门场景，串联成一幅更完整的技术地图。