大模型常见面试题与生产实践

文章目录

  • [1 面试题](#1 面试题)
    • [1 如何确认检索结果是否可靠\](#1 如何确认检索结果是否可靠)
    • [2 如何保证大模型输出json可靠](#2 如何保证大模型输出json可靠)
    • [3 单agent 和 multi-agent系统有什么区别,分别适合什么场景](#3 单agent 和 multi-agent系统有什么区别,分别适合什么场景)

1 面试题

1 如何确认检索结果是否可靠\

不可靠分为: 1 召回不相关。2 关键信息漏掉 top-k没命中 3 来源过时 4 多源矛盾

1 离线评估

2 多来源一致性 交叉验证,不符合就降权

3 来源信任度

4 不可靠怎么救:1 rerank重盘 ,cross-encoder重新打分 ,2 query改写+二次检索, LLM改写query 再查一次,3 兜底,让模型说不会,转人工

5 用户透明: 把命中来源,置信度,是否多元交叉都暴露在前端,再加反馈按钮收点踩做闭环

2 如何保证大模型输出json可靠

  1. Tool Calling 协议(主力)------bind_tools 把 Pydantic schema 转成 function schema,API 层强制 LLM 只能产合规 tool_calls,框架返回已解析对象,根本不经过"写字符串再 parse"
  2. Pydantic schema 校验------参数灌进 BaseModel,类型/必填/长度/enum 不符即 ValidationError
  3. schema 适配 + 入参清洗------_GeminiToolSchemaFixer 补 Gemini array items;_coerce_json_string 自动还原字符串化 JSON
  4. 校验失败 → ReAct 回环------VALIDATION_FAILED 回给 LLM 自我修正,不致命终止
  5. 文本场景多级降级------分析报告 XML 主 + JSON 兜底(正则抠 {...});轻量分词固定行格式 + 失败 fallback

3 单agent 和 multi-agent系统有什么区别,分别适合什么场景

单agent 是一个大模型挂一套工具,自己规划自己执行;multi-agnet是多个角色分工,外加一个协调者。

通信是关键差异,单agent不存在通信问题lmulit-agent必须设计共享memory,消息总线,还有调度中 心。

还有状态问题,单agent自己一条线写;mult-agent多个角色同时改,必须做版本隔离,冲突合并。

任务分配也分两套,单agent时react串行循环;multi-agentyaoyou planner拆任务,router决定派给谁,aggregator收结果

任务垂直,链路清晰,上下文补偿,延迟敏感的场景,用单agent。

任务可拆,需要跨域专家,能容忍更高延迟,比如代码生成里,写测试和改代码 分两个agent跑

可观测也是分水岭:单agent顺一条trace就能排查清楚;multi-agent要追每个agent,加上他们质检所有通信日志才行。

相关推荐
带刺的坐椅1 小时前
从 Claude Code 隐私争议,看 SolonCode 的设计选择
ai·llm·agent·claudecode·soloncode·codingplan
lincats6 小时前
Claude Code项目越写越乱?这套清理流程能救你
ai·ai agent·claude code
云燕实验室CloudLab9 小时前
《AI开始"抱团"思考了!多智能体 + 思维图到底有多强?》
ai·学习工具·智慧学伴
小七-七牛开发者10 小时前
论文解读:DeepSeek DSpark 在真实高并发推理服务中,如何保证 Token 生成又好又快?
ai·大模型·编程·ai coding
doiito16 小时前
【Agent Harness】Gliding Horse 核心设计理念,不跟风开发自己的AI Agent
ai·rust·架构设计·系统设计·ai agent
doiito2 天前
【Agent Harness】Gliding Horse 的 L2 作战地图:让多 Agent 协作从“摸黑”变成“透明”
ai·rust·架构设计·系统设计·ai agent
xiezhr2 天前
逛GitHub发现一款免费带有AI功能的数据库管理工具DBX
ai·开源软件·自然语言·数据库管理工具
垚森3 天前
我用 GLM-5.2 造了个炸裂主题后台:16 套主题随心切,可在线体验
ai·react
doiito4 天前
【Agent Harness】Gliding Horse 工具结果压缩体系:如何用“指针”驯服上下文膨胀
ai·rust·架构设计·系统设计·ai agent
doiito5 天前
【Agent Harness】Gliding Horse 上下文动态感知与智能压缩:让 Agent 真正“听得进”每一句话
ai·rust·架构设计·系统设计·ai agent