阿里云基础设施 AI Tech Day AI 原生,智构未来——AI 原生架构与企业实践专场

活动简介

云为 AI 提供了坚实的基础设施支撑。聚焦阿里云云原生产品技术领域,阿里云基础设施 AI Tech Day 深圳站「AI 原生,智构未来------AI 原生架构与企业实践专场」沙龙于8月29日下午在深圳·LandMarkCoffee 蓝马咖啡举办,活动现场吸引了34家有 AI 建设诉求企业的 45 位技术负责人参与,行业覆盖移动互联网、药业、AI4Science、汽车、互金、OTA 等。本次技术沙龙聚焦企业 AI 应用规模化实战痛点分享 Serverless、AI 网关、可观测、AI 消息队列产品解决方案和企业真实实践,与企业共同探讨如何通过向更先进的架构演进来适应 AI 时代的快速变化,为迎接新的增长机会做好准备。

阿里云智能集团云原生 Serverless 高级解决方案架构师 卢萌凯(洛浩) 分享了《AI 应用正当时,详解基于 MCP 构建 AI Agent 架构新范式》,2025年是 Agent 元年,AI Agent 正成为下一代应用的核心驱动力,Data+AI 成为帮助客户实现业务提效的核心场景,通过自然语言交互、无代码/低代码工具等方式,将数据洞察和AI能力相结合,加速 AI 在企业内部的普及和应用。

在这个过程中,如何开发和落地 AI Agent 应用,业界有哪些最佳实践可以参考,通过详解 AI 应用开发新范式,和广大企业客户一起探讨 AI 应用落地的趋势、挑战和方案。

阿里云智能集团云原生解决方案架构师 姚翔(弑魔) 分享了《AI 时代的智能流量中枢、AI 网关搭建与落地》,AI 网关作为企业级 AI 智能流量中枢,旨在解决 AI 应用爆发增长背景下的多模型集成、安全合规、成本控制及高可用性等核心挑战。其核心能力包括:统一接入代理,支持 OpenAI 协议及 MCP 协议适配,实现多模型(如百炼、DeepSeek)与工具服务的统一调用;安全鉴权管理,通过 API-Key 托管、消费者权限分级及内容安全检测,保障访问控制与数据合规;高可用保障机制,通过限流策略、Fallback 容灾(如 PAI 服务故障时切换至百炼)及 Redis 缓存优化,提升系统稳定性;成本优化能力,结合 AI 缓存、Token 消耗监控及多 API-Key 轮询,降低资源浪费。

在落地实践中,AI 网关针对典型场景提供解决方案:例如,通过模型名称匹配实现单一域名下多模型动态切换,降低服务分发成本;通过消费者授权机制实现用户分级管控,结合审批流自动化 API-Key 管理;利用 Redis 缓存与向量化检索减少重复请求,突破模型服务配额限制;集成夸克联网搜索优化模型幻觉问题,提升推理准确性。此外,其 MCP 代理能力支持企业构建统一工具市场,实现内外部 API 的鉴权收口与运行时管理。

典型应用场景覆盖自建模型服务(如 FC GPU 部署)的稳定性增强、多供应商模型的统一接入管控,以及 Dify 等 AI 平台的观测治理升级。通过协议转换、存量服务无改造接入及 Nacos 动态版本管理,AI 网关助力智慧停车、汽车座舱等垂直领域实现智能化升级。

阿里云智能集团消息队列产品解决方案架构师 邹星宇(吉宪) 分享了《RocketMQ for AI 的事件驱动架构实践》,RocketMQ for AI 的演进,标志着其已从传统消息中间件,全面升级为专为 AI 时代打造的消息引擎。通过在轻量化通信模型与智能化资源调度方面的"颠覆性创新",RocketMQ 突破了传统消息中间件的能力边界,成为构建高可用、可扩展 AI 应用的关键基础设施,展现出其在 AI 工程化体系中的核心价值。

RocketMQ for AI 的增强能力已在阿里巴巴集团内部以及阿里云大模型服务平台百炼、通义灵码等产品中经过大规模生产环境的验证,充分证明了其在高并发、复杂的AI场景下的成熟度与可靠性。

我们坚信,通过持续的技术探索与开放共建,RocketMQ for AI 将推动"AI 原生消息队列"(AI MQ)成为行业标准,助力全球开发者更轻松、更高效地构建下一代智能应用,共同推动 AI 工程实践的标准化、普及化与生态繁荣。

阿里云智能集团云原生可观测解决方案架构师 宋明强(鸣溯)分享了《大模型时代的可观测探索》,从"互联网+"到"人工智能+",随着云原生、多云架构、大语言模型(LLM)的爆发式发展,企业系统复杂度呈指数级增长,传统可观测技术面临海量数据实时分析、跨模态数据整合、根因定位效率等挑战。基于云监控 2.0 的统一数据模型 UModel,结合 Qwen 大模型推理能力与数据理解能力、可观测领域算法构建,大模型为可观测 AIOps 的演进提供了全新思路,将极大提升 Operation 效率和系统智能化水平。另一方面技术也在反哺 AI 领域:模型训练需要可观测性保障资源效率与稳定性,LLM 应用落地依赖实时监控以优化性能与用户体验。

37 手游运维负责人 王钊金分享了《云原生为基,AI 为翼:三七手游运维质效双升智能化探索之路》,讲述了37 手游成功完成云原生化架构的转型与升级,并通过构建低延迟、高可用、智能化的一站式可观测平台,助力 37 手游运维质量和效率提升上取得了显著成效;同时分享了当前基于阿里云百炼+可观测 mcp 服务进行智能运维 AI 探索,通过流程编排及 LLM 以自然语言交互模式,极大提升运维高频查询分析类场景效率。

在最后的客户互动讨论环节,来自阿里云云原生团队的 PDSA、PD 和研发同学,与到场客户一起围绕企业级 AI 应用构建现状、AI Agent 生产环境下的落地场景、当前核心挑战等问题进行了深度讨论和热烈交流。

点击此处,获得【AI 原生架构与企业实践专场】活动 PPT。

相关推荐
Memene摸鱼日报3 小时前
「Memene 摸鱼日报 2025.9.16」OpenAI 推出 GPT-5-Codex 编程模型,xAI 发布 Grok 4 Fast
人工智能·aigc
xiaohouzi1122333 小时前
OpenCV的cv2.VideoCapture如何加GStreamer后端
人工智能·opencv·计算机视觉
用户125205597083 小时前
解决Stable Diffusion WebUI训练嵌入式模型报错问题
人工智能
Juchecar3 小时前
一文讲清 nn.LayerNorm 层归一化
人工智能
martinzh3 小时前
RAG系统大脑调教指南:模型选择、提示设计与质量控保一本通
人工智能
小关会打代码3 小时前
计算机视觉案例分享之答题卡识别
人工智能·计算机视觉
Juchecar3 小时前
一文讲清 nn.Linear 线性变换
人工智能
Se7en2584 小时前
使用 NVIDIA Dynamo 部署 PD 分离推理服务
人工智能
海拥4 小时前
用 LazyLLM 搭建一个代码注释 / 文档 Agent 的实测体验
人工智能