大模型agent中怎么做意图识别的?

文章目录

一、做意图识别的目的

在多agent架构中,首先需要通过意图识别技术解析用户输入的真实目的,为后续决策和行动提供基础。

二、怎么做的

  • 把待分类意图固定有限意图集合,
  • 小的分模型做初步判断
  • 针对置信度较低的,直接用大模型兜底
  • **原因:
    • 成本与推理开销问题
    • 响应速度差距大
    • 大模型容易发散、不稳定
    • 边界场景分工,各司其职(80% 简单请求小模型扛住,20% 难例大模型兜底)
    • 安全风控更可控

三、提高准确率的方法:

  1. 样本迭代 + 坏 case 回流
    线上收集识别错误案例,定期迭代微调分类模型、扩充规则词典,持续优化边缘口语、方言化、模糊表述的 case。
  2. 引入上下文连续性判断
    不只用单句识别,结合上一轮对话状态判断意图。
    比如上一轮正在问诊,用户短句回复,就优先判定为症状补充,避免误判成闲聊。
  3. 禁止越界意图 + 强拦截
    对诱导、越狱、非医疗诉求、恶意提问做独立黑名单意图,提前拦截,既提升准确率又兼顾安全。
  4. Prompt 约束 + 结构化输出
    大模型识别时,强制要求输出固定 JSON 意图结果,加角色约束与场景限定,杜绝自由文本输出带来的识别漂移。
相关推荐
Mem0rin26 分钟前
[Agent基础]Agent、消息和聊天模板
人工智能·transformer
探物 AI2 小时前
Mamba 会替代 Transformer 成为 AI 的下一代底层模型吗?
人工智能·深度学习·transformer
高洁012 小时前
设备故障?数字孪生提前预警
深度学习·机器学习·数据挖掘·transformer·知识图谱
weixin_468466852 小时前
大语言模型原理新手入门指南
人工智能·python·算法·语言模型·自然语言处理·transformer·注意力机制
Jmayday17 小时前
NLP第四章:Transformer架构
人工智能·自然语言处理·transformer
大梦谁先觉i20 小时前
Milvus 向量数据库:原理详解、离线部署、可视化配置与全套实操教程
transformer·guava
猫先生Mr.Mao21 小时前
一文梳理主流 LLM 架构技术演进
人工智能·架构·大模型·llm·transformer
z小猫不吃鱼1 天前
08 BERT 论文精读:双向 Transformer 如何学习语言表示?
学习·bert·transformer
小程故事多_801 天前
深入解析FlashAttention,大模型长序列训练的底层优化核心技术
人工智能·transformer
西西弗Sisyphus1 天前
构建中文版的 nanoGPT - 断点续训(resume from checkpoint)
transformer·attention·注意力·self-attention·nanogpt