意图识别面试通关指南：从基础问答到场景落地

意图识别（Intent Recognition）作为任务型对话系统（Task-oriented Dialogue System）的核心组件，一直是 NLP 算法岗面试的高频考点。本文整理了从基础概念到工程实践的常见面试题，助你从容应对。

参考回答：

意图识别本质上是一个文本分类 任务。它的目标是将用户的自然语言输入映射到预定义的意图类别（如"查天气"、"订机票"、"播放音乐"）中。

在对话系统架构中，它通常位于 NLU（自然语言理解）模块，紧随分词/预处理之后，与槽位填充（Slot Filling）共同构成 NLU 的两大核心任务。

参考回答：

基于规则/模板匹配 ：
- 优点：冷启动快，准确率高（针对特定case），可解释性强。
- 缺点：泛化能力差，维护成本随规则数量指数级上升。
传统机器学习（SVM/LR/Naive Bayes） ：
- 优点：训练速度快，对小样本数据相对友好，模型轻量。
- 缺点：需要繁琐的特征工程（TF-IDF, N-gram），难以捕捉深层语义。
深度学习（CNN/RNN/LSTM） ：
- 优点：自动提取特征，捕捉序列信息（RNN）或局部特征（CNN）。
- 缺点：需要较多标注数据，训练时间较长。
预训练模型（BERT/RoBERTa） ：
- 优点：SOTA 效果，强大的语义表征能力，少样本下微调效果依然出色。
- 缺点：模型庞大，推理延迟高（需蒸馏或量化）。

参考回答：

虽然可以分别训练两个模型，但联合建模（Joint Learning）通常效果更好，因为两者共享语义信息。

常见架构：BERT + CRF 或 BiLSTM + CRF。
机制：编码层共享（如 BERT 输出），意图识别通常取 [CLS] token 进行分类，槽位填充则对每个 token 进行序列标注。
Loss ：Loss=Lossintent+α⋅LossslotLoss = Loss_{intent} + \alpha \cdot Loss_{slot}Loss=Lossintent+α⋅Lossslot。

参考回答：

用户一句话可能包含多个意图（例如："帮我关灯并定个明早八点的闹钟"）。

参考回答：

这是工业界非常关注的问题。

参考回答：

参考回答：

Accuracy：整体准确率。
Precision / Recall / F1-score：针对每个类别的指标，尤其是 F1-score（Macro-F1 或 Micro-F1）更能反映模型在不平衡数据下的表现。
Confusion Matrix：混淆矩阵，用于分析哪些意图容易混淆。

参考回答：

面试中除了背诵八股文，更重要的是结合自己的项目经历，阐述在面对具体困难（如数据少、噪音大、实时性要求高）时的思考过程和解决方案。祝大家面试顺利！