项目目标:为公司旗下汽修连锁品牌开发并部署一个私有化AI智能体,旨在将分散的维修经验系统化、智能化,为技师提供实时决策支持。
1. 智能体私有化部署与领域微调
项目一期核心是打造智能体的"大脑"。我们选择了性能与成本均衡的 DeepSeek-V2 模型作为基座。
-
环境:在客户自有机房部署了双卡GPU服务器。
-
安全:整套系统在内网运行,确保所有维修数据不出域,满足商业安全要求。
-
领域微调 :关键步骤。我们收集了历史积累的约5万条高质量维修记录(包含车型、症状、解决方案文本),对基础大模型进行了全参数指令微调。此步骤旨在让模型深入理解汽修领域的专业术语和问题诊断逻辑,使其从一个"通才"转变为"汽修专家"。
2. 学习阶段:构建多模态知识库
微调后的模型具备了汽修领域的"常识"。但要进行精准案例检索,我们同步构建了一个向量知识库。
-
数据管道:开发了一个数据清洗与解析工具,将每条维修记录中的文本描述(问题、方案)和图片特征(通过CLIP模型提取)转换为向量。
-
存储 :所有向量存入 Chroma 向量数据库。这使得智能体能够进行高效的相似性搜索,而非仅仅依赖模型的内置知识。
3. 智能应用APP:自然交互与精准赋能
我们开发了移动端APP作为智能体的交互界面。
-
交互流程:
-
输入:技师可通过语音或文字描述问题,例如:"一辆2019款奥迪A4L,行驶中方向盘往右跑偏。"
-
推理与回答:APP将问题发送至智能体。智能体的工作流程如下代码所示:
简化版核心处理逻辑
def diagnose(vehicle, problem_text):
# 1. 理解用户意图,提取关键信息(如车型、症状)
intent = agent.understand(problem_text)# 2. 在向量知识库中检索最相似的10个历史案例 similar_cases = vector_db.search(vehicle, intent) # 3. 指令模型基于检索到的案例进行推理和总结 prompt = f"参考案例:{similar_cases}。请诊断:{problem_text}" answer = fine_tuned_llm.generate(prompt) return answer
- 智能体会返回结构化答案,包括最可能的故障原因、概率排序及检查建议。技师可点击查看每个原因对应的历史案例详情(包括现场照片)。
4. 实现"越用越聪明"的数据飞轮
系统的核心优势在于其自我进化能力。
-
闭环设计:每次成功维修后,技师被要求在APP中确认最终解决方案。该方案会与本次查询记录一同被存入数据库。
-
数据优化:我们设置了一个定时任务,每周自动筛选出被多次验证有效的"高价值"案例。
-
模型迭代 :每季度,我们会利用这批新的高质量数据,对已部署的模型进行一次增量微调,从而稳步提升智能体的诊断准确率。
-