

在AI智能体广泛落地的今天,意图识别作为智能体的"第一道关卡",直接决定了用户体验的好坏。然而,通用大模型在特定业务场景下的意图识别准确率往往难以达到预期,用户需要频繁手动修正目标系统,严重影响了整体使用体验。如何以较低成本快速提升意图识别准确率,成为企业AI应用落地的关键挑战之一。
面对这一难题,碧桂园服务"一问"团队通过AI Coding辅助数据工程+模型微调的方式,以极低的成本和时间投入 (训练费用约500元,1人天数据工程,3小时模型训练),将意图识别准确率从48.4%提升至83%以上,实现了近35个百分点的跨越式提升。这套方法不仅验证了小模型微调的可行性,更为企业AI应用提供了一条高性价比的优化路径。
*以下内容来自碧桂园服务"一问"研发团队

"一问"是碧服"零号助理"中的统一AI智能体入口,主要提供系统知识问答能力。自上线运行大半年以来,已接入30多个业务系统的智能体,并积累了大量真实的用户问答数据。然而,在实际使用过程中,其意图识别(即用户问题分类)模块的准确率偏低,评测结果显示为48.4%。这导致用户需要频繁手动修正目标子Agent,影响了整体使用体验和效率。
本项目的核心目标是通过模型微调,显著提升意图识别的准确率,从而优化用户交互流程。
| 项目目标
提高Agent对用户问题的意图识别准确率,改善整体使用体验。
| 取得效果
将意图识别模型的准确率提升至80%以上,并全面替换当前基于工作流的意图智能体。
| 资源投入
a.AI Coding消耗:约300万 Token(基于Claude Code);
b.训练费用:完成3次训练与4次评测,总成本约500元人民币;
c.训练时长:处理10,000条数据并完成3轮微调,耗时约3小时(单价约0.006元/千Token,单次训练150-200元);
d.评测时长:总计约18小时。

借助百炼等模型开发平台,无需搭建训练环境,即可以低代码方式,快速训练和验证模型:
| 基线指标
1.已上线的某意图识别模型:准确率48.4%。

2.训练前的基础模型(千问3-8b):准确率55.35%。

| 数据准备(AI Coding)
1.数据来源:"一问管理后台"-"客服机器人服务记录"。
2.数据标注:30多个子Agent,20万+用户真实问题,已由用户手动纠正真实意图,完成打标。
通过AI编程工具编写脚本,生成最终的训练数据,简要过程如下:
1.读取原始数据,生成jsonl格式。

- 合并训练数据,并进行一些数据清洗。

- 对原始数据进行采样,作为训练数据或测评数据。

- 执行脚本后,得到整理清洗后的数据。

| 数据上传
从全量训练数据中采样10000条作为训练数据,2000条作为评测数据。
训练用的数据,上传到训练集;评测用的数据,上传到评测集。

| 模型训练

| 创建SFT微调训练任务
1.填写任务名称(最好语义化,比如什么提示词,多少训练数据,LORA,重要训练参数等);
2.训练方式:数据量少,选高效训练,即LORA;数据量多,选全参训练,即全量更新;
3.选择模型:预制模型,重新训练;我的模型,追加训练;
4.训练集:提前上传并发布的数据集;
5.训练产出:输出模型名字;
6.其他保持默认;
7.开始训练。



| 模型部署
填入服务名称,选择刚刚训练好的模型。

| 模型评测
训练好的模型,需要进行模型评测,以确定模型的性能。

1.填写任务名称,测评对象,数据来源,评测规则。

2.选择模型-我的模型-部署好的模型。

3.选择已发布的测评数据集。

4.添加评测规则:按当前场景,系统名称必须准确,所以用字符串匹配;输出的内容(output),包含基线的正确答案(completion)。


| 评测结果
评测得分为83%,若继续增加训练数据,可继续提升模型性能。


| 性能提升大
经过训练后的特定模型,准确率从55%提升到83%,最高取得了28%的准确率提升。后续加大训练数据,还可以持续提升准确率。
| 快速原型化
使用SaaS模型训练平台,无需协调出固定的GPU资源,搭建专用训练环境,可快速训练小模型验证可行性;
| 工作效率高
AI Coding极大加快了数据准备和数据清洗速度。
| 训练成本低
单次训练,使用10000条训练数据+3个迭代,仅需约1个小时、200元左右的成本,小模型具有极大的优势。

在大模型技术快速迭代的今天,企业AI应用正从"能用"迈向"好用"的关键阶段。碧桂园服务"一问"团队的实践证明,通过数据驱动的模型微调,企业完全可以用极低的成本实现业务场景的精准适配,让通用AI能力真正落地到具体业务中。
未来,碧桂园服务将持续深耕这一技术路径,进一步探索在更多业务场景中的应用可能,推动AI能力从"单点突破"向"全面赋能"演进,为企业数字化转型注入更强劲的智能动力。
本文作者
刘刚 碧桂园服务企业架构专家
指导人
陈道成 碧桂园服务企业架构高级专家
揭皓翔 碧桂园服务AI高级专家
杜鹏 碧桂园服务数字赋能部总经理