阿里云智能集团首席技术官云栖大会要点总结

阿里云智能集团首席技术官云栖大会要点总结

视频播放地址:https://www.bilibili.com/video/BV1D6JXzeEjV

一、大模型家族(通义系列)

  1. 规模与影响力

    • 已开源 300+ 模型,下载量破 6 亿,原生及衍生模型数量全球第一。
    • 通义千问企业客户超 100 万,衍生模型 17 万+;通义万相累计生成 3.9 亿张图片、7000 万个视频。
  2. 旗舰模型升级

    • 通义千问-Max:万亿参数,Preview 版已并列 GPT-4 位列全球第三;正式版在指令遵循、Coding、Agent 能力再提升。
    • 深度思考(Thinking)模式:AIME 数学奥赛满分水平,逐步上线。
  3. 多模态模型

    • Qwen-VL-Max:256 K 上下文,2 小时视频理解,3D-grounding,可操作电脑/手机。
    • Qwen-Omni:单模型融合文本、图像、音频、视频、语音生成,实时交互延迟降低。
    • Qwen-Code-Pro:与 Queen Code IDE 联合训练,推理加速 30%+,token 消耗下降,安全扫描内置。
  4. 视觉生成

    • 通义万相 2.5-Preview:原生多模态 Transformer,一次性生成 10 s@1080p 音画同步视频;支持图+音频驱动、电影级运镜、图文排版、科学图表。
    • 数字人:5 s 音视频即可克隆声音+表情;支持动作/语音驱动、视频换人等。
  5. 语音模型

    • 通义百灵:ASR 与 CosyVoice 3.0 统一品牌,嘈杂环境识别、多音色合成、行业词定制。
  6. 下一代架构

    • Qwen-Next:混合注意力、高稀疏、多-token 预测,384 B 版本训练资源节省 40%,吞吐↑10×。

二、AI 开发新范式------Agent(智能体)

  1. 四大核心能力

    • 复杂任务自主规划、决策、反思
    • 多层次多模态记忆(具象→抽象,用户级个性化)
    • 信息增强:本地知识、实时数据、领域专家库快速接入
    • Action:调用工具、与现实交互、获得反馈闭环
  2. 产品/工具链

    • 百炼 Agent 平台:低代码拖拽 & AgentScope SDK 双模式;内置 Deep-Research、Rec、Computer-Use 等 Agent。
    • 工具生态:
      -- 原生支持 MCP 协议,15000 容器/分钟沙箱启动;
      -- 私有化 API 一键转 MCP 服务;
      -- 强化学习流水线:数据收集→清洗→奖励模型→policy 迭代。
    • 部署:一键云端发布,企业级高可用、弹性伸缩、可观测。

三、AI 基础设施(全栈优化)

  1. 算力

    • 盘久超级节点:单柜 128 卡,350 kW 供电,全液冷,兼容主流 GPU/NPU。
    • 灵骏集群:单集群可扩展至数十万卡,异构算力(容器/裸金属/虚拟机),故障自动恢复率 98%+。
  2. 网络

    • HPN 8.0:自研交换机+光模块+RDMA,7.0→8.0 从万卡到十万卡级 DC。
    • 跨 DC/跨 Region 高带宽,全球加速网络,VPC 内 RDMA 支持。
  3. 存储

    • CPFS:单客户端 40 GB/s 吞吐,100 万 IOPS,智能冷热分层,成本↓60%。
    • OSS 多模态升级:Vector Bucket 支持 Embedding 存储与检索。
  4. 平台层

    • PAI 训练:计算-通信重叠、序列感知调度,通义大模型训练提速 3 倍。
    • PAI 推理:多级量化、Speculative Decoding、MTP,延迟↓50%,吞吐↑3×。
    • 强化学习框架:同步/异步/多轮交互,训推资源弹性混部。
  5. 数据与安全

    • Lindata/MaxCompute 原生多模态,自然语言数据分析。
    • 全链路安全:训练数据脱敏、模型加密、输入提示词过滤、内容合规审计、AI 对抗攻击拦截率↑40%。
  6. 部署与弹性

    • 百炼模型服务:国内+国际双站,1000+ 模型,100 TPS 级生成,12 个月调用量↑15 倍。
    • 企业定制:预训练阶段即可融合私有数据,全工具链(训练→评测→部署)开放。

四、一句话总结

阿里云已构建"大模型全栈自研 + Agent 低代码生态 + 十万卡级 AI 基础设施"三位一体体系,面向全球开发者提供从训练、推理到智能体落地的端到端平台。

相关推荐
平凡而伟大(心之所向)8 小时前
云架构设计与实践:从基础到未来趋势
人工智能·阿里云·系统架构·安全架构
eddy-原13 小时前
阿里云核心服务解析与应用实践
linux·运维·阿里云·云计算
weixin_3077791315 小时前
基于AWS服务的客户服务电话情感分析解决方案
人工智能·深度学习·机器学习·云计算·aws
tnan252216 小时前
基于阿里云效实现cicd记录
阿里云·ci/cd·docker·容器·自动化
Heavydrink18 小时前
阿里云龙蜥8系统安装Docker详细教程
阿里云·docker·云计算
后端小张21 小时前
【案例实战】初探鸿蒙开放能力:从好奇到实战的技术发现之旅
分布式·华为·云计算·harmonyos·鸿蒙·鸿蒙系统·万物互联
weixin_3077791321 小时前
应对不规则负载的异步ML模型服务AWS架构设计
人工智能·深度学习·机器学习·云计算·aws
AWS官方合作商1 天前
AWS云计算入门指南:从零到一,详解核心服务与免费套餐
云计算·aws
星释1 天前
阿里云Windows数据2T以上磁盘扩容方案
阿里云·云计算
云资源服务商1 天前
深度解析阿里云通用算力型U1与U2i实例性能差异:架构、算力、场景选型全对比
服务器·阿里云·云计算