智能体对话全面进化：多模态融合重塑交互体验

一、产品定位

360智汇云的智能体对话产品是一套面向业务系统的多模态交互引擎，用户可以通过语音、图像、文本的形式，或者三者融合的形式，实现更高效、更自然的AI客服对话智能交互体验。

一键配置AI客服，简单高效，节省部署和开发成本。

智能体对话产品使用地址：https://zyun.360.cn/product/aimi

二、核心升级点

2.1、多模态融合

文本、语音、视觉三种能力协同工作，实现从「单点回答」升级为「综合理解」

搭配图像理解 → 获取画面关键信息
文本补充说明 → 形成完整上下文

2.2. 语音转文字

实时流式转写
高精度自动纠错

2.3. 示例问题推荐

用户可自定义智能体默认问题，降低用户体验成本

三、产品价值

1. 缩短上线周期，减少研发投入

前端一次接入即可复用，不管接多少模型都不再重复适配。研发成本、沟通成本明显下降。

2. 提升系统稳定性与可维护性

协议标准化后，智能体行为统一，前端体验稳定，后端升级不影响业务。

3. 可灵活组合模型能力，满足更多业务场景

企业无需依赖单一厂商，可按需选择"高性能""低成本""多模态"等类型的模型，让应用覆盖更多业务人群与需求。

4. 可持续演进，不被技术迭代拖累

底层模型更新快，但企业无需重构前端，只要替换协议适配器即可升级能力，保护既有投资。

5. 多模态交互体验更完整

企业可快速接入语音、视频、图像、文本等复杂交互，让产品更自然、人性化，提高用户留存。

四、案例介绍

使用智能体对话搭建多模态AI助手

4.1、新建项目

智能体对话产品使用地址：https://zyun.360.cn/product/aimi

智能体对话-项目管理-新建项目

4.2、选择类型

根据业务场景选择类型，支持语音对话、视觉理解及消息对话单场景
新增自定义模式，支持语音对话、视觉理解与消息对话场景进行组合
右侧根据类型选择展示预览图

4.3、配置流程

根据场景选择配置流程，欢迎语、STT、TTS 及 Agent
智汇云内已预置模型，可按需使用

4.4、文本框设置

支持文本框名称、备注及输入框提示词信息自定义
支持主题选择，目前内置6种主题
支持示例问题配置，目前最多可配置3个内置问题

4.5、项目使用

项目创建完成后，点击项目名称进入详情
点击右上角发布按钮，可通过在线查看进行体验与测试

点击嵌入网站按钮，选择物业需要场景，可复制前端嵌入SDK

五、总结

智能体对话产品的核心价值在于以统一的前端 SDK 与 AGUI 标准协议，实现对多种智能体的无缝接入，彻底摆脱模型与协议差异带来的复杂性。业务方无需为不同厂商、大模型或多模态能力反复适配，一次集成即可覆盖文本、语音、视觉等全场景交互，显著降低研发与维护成本。同时，服务端通过协议适配层灵活对接 A2A、Dify、OpenAI 等生态，让企业可以按需选择最优模型组合，在性能与成本之间自由切换。整个体系既保障前端体验一致稳定，又为企业提供持续演进能力，帮助快速构建可靠、可扩展、可升级的智能对话应用。

在线体验地址：https://webrtc.zyun.360.cn/agent_talk/page/

智能体对话产品使用地址：https://zyun.360.cn/product/aimi