阿里云智能集团首席技术官云栖大会要点总结

阿里云智能集团首席技术官云栖大会要点总结

视频播放地址:https://www.bilibili.com/video/BV1D6JXzeEjV

一、大模型家族(通义系列)

  1. 规模与影响力

    • 已开源 300+ 模型,下载量破 6 亿,原生及衍生模型数量全球第一。
    • 通义千问企业客户超 100 万,衍生模型 17 万+;通义万相累计生成 3.9 亿张图片、7000 万个视频。
  2. 旗舰模型升级

    • 通义千问-Max:万亿参数,Preview 版已并列 GPT-4 位列全球第三;正式版在指令遵循、Coding、Agent 能力再提升。
    • 深度思考(Thinking)模式:AIME 数学奥赛满分水平,逐步上线。
  3. 多模态模型

    • Qwen-VL-Max:256 K 上下文,2 小时视频理解,3D-grounding,可操作电脑/手机。
    • Qwen-Omni:单模型融合文本、图像、音频、视频、语音生成,实时交互延迟降低。
    • Qwen-Code-Pro:与 Queen Code IDE 联合训练,推理加速 30%+,token 消耗下降,安全扫描内置。
  4. 视觉生成

    • 通义万相 2.5-Preview:原生多模态 Transformer,一次性生成 10 s@1080p 音画同步视频;支持图+音频驱动、电影级运镜、图文排版、科学图表。
    • 数字人:5 s 音视频即可克隆声音+表情;支持动作/语音驱动、视频换人等。
  5. 语音模型

    • 通义百灵:ASR 与 CosyVoice 3.0 统一品牌,嘈杂环境识别、多音色合成、行业词定制。
  6. 下一代架构

    • Qwen-Next:混合注意力、高稀疏、多-token 预测,384 B 版本训练资源节省 40%,吞吐↑10×。

二、AI 开发新范式------Agent(智能体)

  1. 四大核心能力

    • 复杂任务自主规划、决策、反思
    • 多层次多模态记忆(具象→抽象,用户级个性化)
    • 信息增强:本地知识、实时数据、领域专家库快速接入
    • Action:调用工具、与现实交互、获得反馈闭环
  2. 产品/工具链

    • 百炼 Agent 平台:低代码拖拽 & AgentScope SDK 双模式;内置 Deep-Research、Rec、Computer-Use 等 Agent。
    • 工具生态:
      -- 原生支持 MCP 协议,15000 容器/分钟沙箱启动;
      -- 私有化 API 一键转 MCP 服务;
      -- 强化学习流水线:数据收集→清洗→奖励模型→policy 迭代。
    • 部署:一键云端发布,企业级高可用、弹性伸缩、可观测。

三、AI 基础设施(全栈优化)

  1. 算力

    • 盘久超级节点:单柜 128 卡,350 kW 供电,全液冷,兼容主流 GPU/NPU。
    • 灵骏集群:单集群可扩展至数十万卡,异构算力(容器/裸金属/虚拟机),故障自动恢复率 98%+。
  2. 网络

    • HPN 8.0:自研交换机+光模块+RDMA,7.0→8.0 从万卡到十万卡级 DC。
    • 跨 DC/跨 Region 高带宽,全球加速网络,VPC 内 RDMA 支持。
  3. 存储

    • CPFS:单客户端 40 GB/s 吞吐,100 万 IOPS,智能冷热分层,成本↓60%。
    • OSS 多模态升级:Vector Bucket 支持 Embedding 存储与检索。
  4. 平台层

    • PAI 训练:计算-通信重叠、序列感知调度,通义大模型训练提速 3 倍。
    • PAI 推理:多级量化、Speculative Decoding、MTP,延迟↓50%,吞吐↑3×。
    • 强化学习框架:同步/异步/多轮交互,训推资源弹性混部。
  5. 数据与安全

    • Lindata/MaxCompute 原生多模态,自然语言数据分析。
    • 全链路安全:训练数据脱敏、模型加密、输入提示词过滤、内容合规审计、AI 对抗攻击拦截率↑40%。
  6. 部署与弹性

    • 百炼模型服务:国内+国际双站,1000+ 模型,100 TPS 级生成,12 个月调用量↑15 倍。
    • 企业定制:预训练阶段即可融合私有数据,全工具链(训练→评测→部署)开放。

四、一句话总结

阿里云已构建"大模型全栈自研 + Agent 低代码生态 + 十万卡级 AI 基础设施"三位一体体系,面向全球开发者提供从训练、推理到智能体落地的端到端平台。

相关推荐
ProgrammerPulse3 小时前
从传统架构到超融合:关键技术演进与架构范式转换科普
云计算
搞科研的小刘选手8 小时前
【厦门大学主办】第六届计算机科学与管理科技国际学术会议(ICCSMT 2025)
人工智能·科技·计算机网络·计算机·云计算·学术会议
TH_111 小时前
腾讯云-(8)-宝塔面板-安装Docker
docker·云计算·腾讯云
我先去打把游戏先12 小时前
ESP32学习笔记(基于IDF):基于OneNet的ESP32的OTA功能
笔记·物联网·学习·云计算·iphone·aws
TH_113 小时前
腾讯云-(3)-Linux宝塔面板使用
linux·云计算·腾讯云
wavemap16 小时前
阿里云38元一年200M轻量云服务器详细评测
服务器·阿里云·云计算·vps·评测·boboforum
懂得节能嘛.16 小时前
【SDK开发实践】从Java编码到阿里云制品仓库部署
java·阿里云·maven
TH_118 小时前
腾讯云-(5)-宝塔软件安装
云计算·腾讯云
源码技术栈19 小时前
Java基于云计算的社区门诊系统源码 医院门诊系统源码 已实现医保结算 SaaS模式
java·云计算·源码·诊所·门诊·预约挂号·云门诊
wanhengidc19 小时前
机架式服务器有什么作用?
运维·服务器·web安全·智能手机·云计算