AI面试·高难度题

高难度题（10个）

1. 设计一个多模态RAG系统，用于医学影像报告生成。请描述架构、关键技术及挑战。
答案： 架构：① 图像编码器（如CNN/ViT）提取影像特征；② 将特征向量存入多模态向量数据库；③ 用户输入文本查询，同时检索相关图像和报告片段；④ 多模态大模型（如Qwen-VL）结合图像和文本生成报告。关键技术：跨模态对齐、联合检索、图文融合生成。挑战：① 医学影像标注昂贵，数据稀缺；② 模型需理解影像与报告间的复杂关系；③ 生成报告需符合医疗规范，错误容忍度低。

2. 假设你需要微调一个70亿参数的医疗模型，但只有单张24GB显存的GPU，如何设计微调方案？
答案： 可采用LoRA或Q-LoRA（量化LoRA），将模型量化到4-bit，同时只训练少量低秩适配器。使用梯度累积、混合精度训练，并可能采用DeepSpeed ZeRO-3或模型并行。另外，可考虑使用Parameter-Efficient Fine-Tuning（PEFT）库，并调整batch size和序列长度以适应显存。

3. 在自然语言转SQL任务中，如何处理数据库Schema的动态变化（如新增表、字段）？
答案： 方案：① 将Schema信息作为动态上下文注入到Agent的提示中，每次查询前获取最新Schema；② 使用向量存储Schema描述，让Agent检索相关表信息；③ 设计Schema解析器，将自然语言映射到当前Schema；④ 对于复杂变化，可定期微调模型以适应新Schema，或采用持续学习。

4. 你提到在RAG系统中使用Reranker重排序，请详细说明Reranker的工作原理，并比较它和双编码器检索的异同。
答案： 双编码器（如BERT双塔）将查询和文档分别编码为向量，通过余弦相似度快速检索，适合大规模候选集。Reranker则使用交叉编码器（如BERT交叉）将查询-文档对一起输入，计算更精确的相关性分数，但计算量大，通常用于重排前Top-K结果。Reranker能捕捉更深层次的交互，但速度慢，二者常结合使用。

5. 在企业HR制度问答系统中，如果员工提问涉及隐私信息（如个人薪资），如何设计安全机制？
答案： ① 在RAG检索阶段过滤掉包含个人隐私的文档（如通过元数据标记）；② 在Prompt中加入指令，禁止模型回答涉及个人隐私的问题，并引导用户联系HR部门；③ 使用模型微调时，训练模型识别敏感问题并拒绝回答；④ 结合Function Calling，调用外部权限验证接口，只有授权用户才能获取特定信息；⑤ 日志审计和脱敏处理。

6. 你在医疗项目中使用了0.5B的小模型，为什么选择这个规模？在资源有限的情况下，如何平衡模型大小与效果？
答案： 0.5B模型适合快速实验和边缘部署，且医疗领域可能不需要超大模型。平衡策略：① 先用小模型验证数据质量和微调流程；② 若效果不足，逐步增大模型，同时采用量化、蒸馏等技术压缩；③ 结合RAG引入外部知识，弥补小模型容量不足；④ 评估任务复杂度，若任务简单（如常见疾病问答），小模型可能足够。

7. 你使用LangGraph构建Agent，请描述一个多智能体协作的复杂场景，并说明如何设计图结构。
答案： 例如，医疗诊断辅助系统：一个智能体负责症状询问，一个负责检索医学知识，一个负责生成初步诊断，一个负责检查处方合理性。图结构：开始节点进入"症状收集"，然后并行调用"知识检索"和"历史记录查询"，结果合并后进入"诊断推理"，最后"处方检查"并输出。LangGraph中可以用节点表示智能体或操作，边表示数据流和控制流，支持条件分支（如诊断置信度低则返回询问）。

8. 在RAG系统中，如何应对检索结果不相关或噪声过大的问题？请给出至少三种策略。
答案： ① 优化检索质量：使用更好的嵌入模型、混合检索、元数据过滤；② 在生成阶段加入"上下文相关性判断"：让模型先判断检索内容是否相关，若不相关则忽略或重新检索；③ 引入多步检索：先检索粗粒度，再根据初步答案进行二次检索；④ 使用Reranker过滤噪声；⑤ 训练一个判别器来评估检索块的相关性。

9. 你提到在视频摘要项目中使用了阿里视觉百炼大模型，请说明视频摘要的关键技术点，以及如何评估摘要质量。
答案： 视频摘要通常包括：关键帧提取、视觉特征编码、文本生成。阿里视觉百炼可能提供视频理解能力，如镜头分割、物体识别、场景描述等，然后通过大模型生成摘要。评估：① 客观指标如ROUGE、BERTScore与人工标注摘要对比；② 主观评估流畅性、信息完整性；③ 对于告警类摘要，需评估准确性和时效性。

10. 在动态SQL生成项目中，如何防止SQL注入攻击？同时，如何确保生成的SQL符合业务规则（如权限限制）？
答案： ① 使用参数化查询或ORM，避免直接拼接SQL；② 让Agent生成SQL模板，再填充参数，而不是直接生成完整SQL；③ 在Function Calling中，对生成的SQL进行语法分析和合法性校验，例如限制只允许SELECT，禁止DROP等；④ 结合用户权限，动态修改SQL（如追加WHERE user_id = current_user）；⑤ 使用数据库视图或存储过程封装业务规则，让Agent只能调用预定义接口。