碧服智能体进化:AI赋能意图识别能力,“一问”更智能

在AI智能体广泛落地的今天,意图识别作为智能体的"第一道关卡",直接决定了用户体验的好坏。然而,通用大模型在特定业务场景下的意图识别准确率往往难以达到预期,用户需要频繁手动修正目标系统,严重影响了整体使用体验。如何以较低成本快速提升意图识别准确率,成为企业AI应用落地的关键挑战之一。

面对这一难题,碧桂园服务"一问"团队通过AI Coding辅助数据工程+模型微调的方式,以极低的成本和时间投入 (训练费用约500元,1人天数据工程,3小时模型训练),将意图识别准确率从48.4%提升至83%以上,实现了近35个百分点的跨越式提升。这套方法不仅验证了小模型微调的可行性,更为企业AI应用提供了一条高性价比的优化路径。

*以下内容来自碧桂园服务"一问"研发团队

"一问"是碧服"零号助理"中的统一AI智能体入口,主要提供系统知识问答能力。自上线运行大半年以来,已接入30多个业务系统的智能体,并积累了大量真实的用户问答数据。然而,在实际使用过程中,其意图识别(即用户问题分类)模块的准确率偏低,评测结果显示为48.4%。这导致用户需要频繁手动修正目标子Agent,影响了整体使用体验和效率。

本项目的核心目标是通过模型微调,显著提升意图识别的准确率,从而优化用户交互流程。

| 项目目标

提高Agent对用户问题的意图识别准确率,改善整体使用体验。

| 取得效果

将意图识别模型的准确率提升至80%以上,并全面替换当前基于工作流的意图智能体。

| 资源投入

a.AI Coding消耗:约300万 Token(基于Claude Code);

b.训练费用:完成3次训练与4次评测,总成本约500元人民币;

c.训练时长:处理10,000条数据并完成3轮微调,耗时约3小时(单价约0.006元/千Token,单次训练150-200元);

d.评测时长:总计约18小时。

借助百炼等模型开发平台,无需搭建训练环境,即可以低代码方式,快速训练和验证模型

| 基线指标

1.已上线的某意图识别模型:准确率48.4%。

2.训练前的基础模型(千问3-8b):准确率55.35%。

| 数据准备(AI Coding)

1.数据来源:"一问管理后台"-"客服机器人服务记录"。

2.数据标注:30多个子Agent,20万+用户真实问题,已由用户手动纠正真实意图,完成打标。

通过AI编程工具编写脚本,生成最终的训练数据,简要过程如下:

1.读取原始数据,生成jsonl格式。

  1. 合并训练数据,并进行一些数据清洗。
  1. 对原始数据进行采样,作为训练数据或测评数据。
  1. 执行脚本后,得到整理清洗后的数据。

| 数据上传

从全量训练数据中采样10000条作为训练数据,2000条作为评测数据。

训练用的数据,上传到训练集;评测用的数据,上传到评测集。

| 模型训练

| 创建SFT微调训练任务

1.填写任务名称(最好语义化,比如什么提示词,多少训练数据,LORA,重要训练参数等);

2.训练方式:数据量少,选高效训练,即LORA;数据量多,选全参训练,即全量更新;

3.选择模型:预制模型,重新训练;我的模型,追加训练;

4.训练集:提前上传并发布的数据集;

5.训练产出:输出模型名字;

6.其他保持默认;

7.开始训练。

| 模型部署

填入服务名称,选择刚刚训练好的模型。

| 模型评测

训练好的模型,需要进行模型评测,以确定模型的性能。

1.填写任务名称,测评对象,数据来源,评测规则。

2.选择模型-我的模型-部署好的模型。

3.选择已发布的测评数据集。

4.添加评测规则:按当前场景,系统名称必须准确,所以用字符串匹配;输出的内容(output),包含基线的正确答案(completion)。

| 评测结果

评测得分为83%,若继续增加训练数据,可继续提升模型性能。

| 性能提升大

经过训练后的特定模型,准确率从55%提升到83%,最高取得了28%的准确率提升。后续加大训练数据,还可以持续提升准确率。

| 快速原型化

使用SaaS模型训练平台,无需协调出固定的GPU资源,搭建专用训练环境,可快速训练小模型验证可行性;

| 工作效率高

AI Coding极大加快了数据准备和数据清洗速度。

| 训练成本低

单次训练,使用10000条训练数据+3个迭代,仅需约1个小时、200元左右的成本,小模型具有极大的优势。

在大模型技术快速迭代的今天,企业AI应用正从"能用"迈向"好用"的关键阶段。碧桂园服务"一问"团队的实践证明,通过数据驱动的模型微调,企业完全可以用极低的成本实现业务场景的精准适配,让通用AI能力真正落地到具体业务中。

未来,碧桂园服务将持续深耕这一技术路径,进一步探索在更多业务场景中的应用可能,推动AI能力从"单点突破"向"全面赋能"演进,为企业数字化转型注入更强劲的智能动力。

本文作者

刘刚 碧桂园服务企业架构专家

指导人

陈道成 碧桂园服务企业架构高级专家

揭皓翔 碧桂园服务AI高级专家

杜鹏 碧桂园服务数字赋能部总经理

相关推荐
AI_小站3 小时前
6个GitHub爆火的免费大模型教程,助你快速进阶AI编程
人工智能·langchain·github·知识图谱·agent·llama·rag
xindoo3 小时前
GitHub Trending霸榜!深度解析AI Coding辅助神器 Superpowers
人工智能·github
时间之里3 小时前
【深度学习】:RF-DETR与yolo对比
人工智能·深度学习·yolo
北京阿法龙科技有限公司3 小时前
数智化升级:AR 智能眼镜驱动工业运维效能革新
人工智能
风落无尘3 小时前
《智能重生:从垃圾堆到AI工程师》——第二章 概率与生存
大数据·人工智能
j_xxx404_3 小时前
Linux:静态链接与动态链接深度解析
linux·运维·服务器·c++·人工智能
档案宝档案管理4 小时前
无缝对接财务软件,实现会计档案全流程自动化流转
大数据
收获不止数据库4 小时前
达梦9发布会归来:AI 时代,我们需要一款什么样的数据库?
数据库·人工智能·ai·语言模型·数据分析
hhb_6184 小时前
AI全栈编程生存指南
人工智能
AI-Frontiers4 小时前
transformer进阶之路:#2 工作原理详解
人工智能·深度学习·transformer