碧服智能体进化:AI赋能意图识别能力,“一问”更智能

在AI智能体广泛落地的今天,意图识别作为智能体的"第一道关卡",直接决定了用户体验的好坏。然而,通用大模型在特定业务场景下的意图识别准确率往往难以达到预期,用户需要频繁手动修正目标系统,严重影响了整体使用体验。如何以较低成本快速提升意图识别准确率,成为企业AI应用落地的关键挑战之一。

面对这一难题,碧桂园服务"一问"团队通过AI Coding辅助数据工程+模型微调的方式,以极低的成本和时间投入 (训练费用约500元,1人天数据工程,3小时模型训练),将意图识别准确率从48.4%提升至83%以上,实现了近35个百分点的跨越式提升。这套方法不仅验证了小模型微调的可行性,更为企业AI应用提供了一条高性价比的优化路径。

*以下内容来自碧桂园服务"一问"研发团队

"一问"是碧服"零号助理"中的统一AI智能体入口,主要提供系统知识问答能力。自上线运行大半年以来,已接入30多个业务系统的智能体,并积累了大量真实的用户问答数据。然而,在实际使用过程中,其意图识别(即用户问题分类)模块的准确率偏低,评测结果显示为48.4%。这导致用户需要频繁手动修正目标子Agent,影响了整体使用体验和效率。

本项目的核心目标是通过模型微调,显著提升意图识别的准确率,从而优化用户交互流程。

| 项目目标

提高Agent对用户问题的意图识别准确率,改善整体使用体验。

| 取得效果

将意图识别模型的准确率提升至80%以上,并全面替换当前基于工作流的意图智能体。

| 资源投入

a.AI Coding消耗:约300万 Token(基于Claude Code);

b.训练费用:完成3次训练与4次评测,总成本约500元人民币;

c.训练时长:处理10,000条数据并完成3轮微调,耗时约3小时(单价约0.006元/千Token,单次训练150-200元);

d.评测时长:总计约18小时。

借助百炼等模型开发平台,无需搭建训练环境,即可以低代码方式,快速训练和验证模型

| 基线指标

1.已上线的某意图识别模型:准确率48.4%。

2.训练前的基础模型(千问3-8b):准确率55.35%。

| 数据准备(AI Coding)

1.数据来源:"一问管理后台"-"客服机器人服务记录"。

2.数据标注:30多个子Agent,20万+用户真实问题,已由用户手动纠正真实意图,完成打标。

通过AI编程工具编写脚本,生成最终的训练数据,简要过程如下:

1.读取原始数据,生成jsonl格式。

  1. 合并训练数据,并进行一些数据清洗。
  1. 对原始数据进行采样,作为训练数据或测评数据。
  1. 执行脚本后,得到整理清洗后的数据。

| 数据上传

从全量训练数据中采样10000条作为训练数据,2000条作为评测数据。

训练用的数据,上传到训练集;评测用的数据,上传到评测集。

| 模型训练

| 创建SFT微调训练任务

1.填写任务名称(最好语义化,比如什么提示词,多少训练数据,LORA,重要训练参数等);

2.训练方式:数据量少,选高效训练,即LORA;数据量多,选全参训练,即全量更新;

3.选择模型:预制模型,重新训练;我的模型,追加训练;

4.训练集:提前上传并发布的数据集;

5.训练产出:输出模型名字;

6.其他保持默认;

7.开始训练。

| 模型部署

填入服务名称,选择刚刚训练好的模型。

| 模型评测

训练好的模型,需要进行模型评测,以确定模型的性能。

1.填写任务名称,测评对象,数据来源,评测规则。

2.选择模型-我的模型-部署好的模型。

3.选择已发布的测评数据集。

4.添加评测规则:按当前场景,系统名称必须准确,所以用字符串匹配;输出的内容(output),包含基线的正确答案(completion)。

| 评测结果

评测得分为83%,若继续增加训练数据,可继续提升模型性能。

| 性能提升大

经过训练后的特定模型,准确率从55%提升到83%,最高取得了28%的准确率提升。后续加大训练数据,还可以持续提升准确率。

| 快速原型化

使用SaaS模型训练平台,无需协调出固定的GPU资源,搭建专用训练环境,可快速训练小模型验证可行性;

| 工作效率高

AI Coding极大加快了数据准备和数据清洗速度。

| 训练成本低

单次训练,使用10000条训练数据+3个迭代,仅需约1个小时、200元左右的成本,小模型具有极大的优势。

在大模型技术快速迭代的今天,企业AI应用正从"能用"迈向"好用"的关键阶段。碧桂园服务"一问"团队的实践证明,通过数据驱动的模型微调,企业完全可以用极低的成本实现业务场景的精准适配,让通用AI能力真正落地到具体业务中。

未来,碧桂园服务将持续深耕这一技术路径,进一步探索在更多业务场景中的应用可能,推动AI能力从"单点突破"向"全面赋能"演进,为企业数字化转型注入更强劲的智能动力。

本文作者

刘刚 碧桂园服务企业架构专家

指导人

陈道成 碧桂园服务企业架构高级专家

揭皓翔 碧桂园服务AI高级专家

杜鹏 碧桂园服务数字赋能部总经理

相关推荐
人工智能AI技术2 小时前
Visual Studio Code 1.114 更新:AI 聊天体验全面优化
人工智能
天一生水water2 小时前
故障诊断的常用github仓库
人工智能·智慧油田
Deepoch2 小时前
VLA 边缘智能新范式:Deepoc 开发板赋能巡检机器人全自主现场决策
人工智能·机器人·巡检·具身模型·deepoc
花千树-0102 小时前
Java 接入多家大模型 API 实战对比
java·开发语言·人工智能·ai·langchain·ai编程
ZPC82102 小时前
rviz2 仿真控制器与真实机器人切换
人工智能·算法·机器人
smileNicky2 小时前
乐奇眼镜 Rokid Glasses AI旅游助手开发指南
人工智能
蓝天守卫者联盟12 小时前
如何选择二氯甲烷回收设备厂家:技术路线与市场格局深度解析
大数据·人工智能·python·sqlite·tornado
xiaoduo AI2 小时前
客服机器人能否支持自动排班与请假?Agent 系统支持人员替班,夜间无人值守该如何应
大数据·人工智能·机器人
nap-joker2 小时前
FT-Mamba:一种高效的表回归的新深度学习模型
人工智能·深度学习·ftmamba