AI动态简报之算力基建篇(2026.05.23)

关注方向:大模型 · GPU算力 · AI芯片 · 云计算 · 大模型API


⚡ 第1条:智谱GLM-5.1高速版API刷新全球速度上限

核心信息

智谱发布GLM-5.1高速版API(GLM-5.1-highspeed),输出速度达400 tokens/s,刷新全球大模型厂商API速度纪录。首次在国产大模型中将旗舰级模型能力与极致低延迟同时带入生产环境,打破"高速模型=轻量级模型"的行业惯例。

性能/价格对比

  • 输出速度:400 tokens/s(全球大模型API速度上限)
  • 对比:传统高速API通常在100-200 tokens/s,旗舰模型往往牺牲速度换取质量
  • 适用场景:AI编程、实时交互、商业决策、实时语音等速度敏感场景

对开发者/企业的影响

AI编程场景可"10倍速"写代码;3D游戏实时建模、即时交互界面生成等此前因延迟无法实现的产品形态开始具备落地可能。目前通过智谱MaaS平台向部分企业客户开放。

信息来源:新浪财经(格隆汇) | 2026-05-22


⚡ 第2条:阿里云发布真武M890芯片+Qwen3.7-Max,全栈AI能力再升级

核心信息

2026年5月20日阿里云峰会上,阿里巴巴发布新一代自研AI芯片平头哥真武M890(已搭载于超节点服务器)及最新旗舰模型Qwen3.7-Max,同时推出适配Agent的产品官网"千问云"并优化百炼平台。

性能/价格对比

  • 真武M890:平头哥芯片累计交付已超47万片(2026年3月数据),本次为新一代升级版
  • Qwen3.7-Max:今年以来日均Token收入增长15倍,MaaS服务已实现盈利
  • 市场地位:阿里云CTO刘伟光表示,在AI云增量市场、大语言模型市场、推理市场"已拿到大部分"

对开发者/企业的影响

阿里云在金融、汽车、政务、运营商等核心行业依靠庞大客户规模形成壁垒;开发者可通过百炼平台调用Qwen3.7-Max,Agent开发者可直接使用"千问云"官网构建应用。

信息来源:财新网 | 2026-05-21


⚡ 第3条:2026年中国AI应用爆发------日均Token调用量突破140万亿

核心信息

量子位第四届中国AIGC产业峰会(5月20日)发布《2026年中国AI应用全景图谱报告》:2026年4月国内AI应用Web端月访问量突破9亿,APP端月下载量超2.4亿,日活同比增长223%;中国日均Token调用量突破140万亿,两年增长超千倍。

性能/价格对比

  • Token调用量:140万亿/天(2026年4月),两年增长超1000倍
  • Agent单次Token消耗达传统AI的百倍
  • DeepSeek V4-Pro API价格仅0.025元/百万tokens,为GPT-5.5的七分之一
  • 模型普惠化趋势明显,价格战持续

对开发者/企业的影响

AI应用进入爆发期,Web端AI效率办公用户活跃份额超七成,AI创作APP端日活同比增长449%;企业AI化门槛大幅降低,但同时也面临Token成本管控挑战(Agent消耗为传统AI百倍)。

信息来源:凤凰网科技 | 2026-05-20


⚡ 第4条:算力租赁市场井喷------160亿至190亿元大单落地

核心信息

2026年中国智能算力规模预计达1460.3 EFLOPS,为2024年的两倍。算力租赁市场景气度高企,A股上市公司密集抛出亿元级算力采购订单。5月东阳光(600673.SH)控股子公司签署《算力服务采购框架合同》,合同预计总金额高达160亿元至190亿元。

性能/价格对比

  • 2026年中国智能算力规模:1460.3 EFLOPS(为2024年的2倍)
  • 东阳光算力采购大单:160亿~190亿元(2026年5月)
  • 2025年云计算企业注册量17.1万家,创近十年峰值,同比增长19.8%
  • 截至2026年5月,云计算相关专利累计3.0万项,发明专利占比近90%

对开发者/企业的影响

算力供给持续扩张,租赁成本有望随规模效应下降;中小企业通过云平台获取算力的门槛降低,但头部大客户锁定优质算力资源可能引发阶段性供需紧张。云计算正从"资源池"向"算力+模型+服务"全栈形态演进。

信息来源:新浪财经 | 2026-05-22


⚡ 第5条:大模型商业化变局------Anthropic年收入440亿美元反超OpenAI

核心信息

2026年5月大模型产业商业化加速分化:Anthropic年化收入达440亿美元,超越OpenAI的250亿美元;字节跳动年度资本开支预计突破2000亿元,阿里巴巴未来AI相关支出将远超3800亿元;北美四大科技巨头2026年合计资本开支预计达6500亿美元。消费端涨价潮来袭------智谱价格上调83%,行业从"流量争夺"转向"价值收割"。

性能/价格对比

  • Anthropic年化收入:440亿美元 vs OpenAI:250亿美元(Anthropic反超)
  • 字节跳动年度资本开支:突破2000亿元
  • 阿里巴巴未来AI支出:远超3800亿元
  • 北美四大科技巨头合计资本开支:6500亿美元(2026年预计)
  • Gartner预测全球数据中心支出增长:55.8%
  • 智谱API价格涨幅:+83%(消费端)

对开发者/企业的影响

API成本存在上行压力,企业需建立Token成本管控机制;OpenAI在30天API测试中消耗6030亿Token、成本130.5万美元,关闭"极速模式"可降低77%成本------模型效率优化成为企业竞争力关键。同时,头部厂商资本开支狂奔,中小玩家生存空间进一步压缩。

信息来源:ITBEAR科技资讯 | 2026-05-19


相关推荐
城事漫游Molly8 分钟前
如何用 ChatGPT 辅助写文献综述,而不是编造文献?
人工智能·chatgpt·提示词·ai for science·文献综述
-山中问答-8 分钟前
【智能体工具使用实战06】工具增强型Agent的评测体系
人工智能·智能体·工具调用·测评体系
_codemonster11 分钟前
手语识别损失函数
人工智能·深度学习·机器学习
2601_9599822124 分钟前
数字化浪潮下的科技商贸融合发展新趋势
人工智能
MemoriKu26 分钟前
Flutter 本地 AI 相册工程收口:从屏幕常亮、标签体系到照片属性后台队列
大数据·人工智能·python·flutter·elasticsearch·搜索引擎·数据库架构
带娃的IT创业者32 分钟前
GitHub 热门: coleam00/Archon —— 当 AI Agent 学会自我进化
人工智能·github·开源项目·ai agent·智能体·自我进化
云烟成雨TD34 分钟前
Agent Scope Java 2.x 系列【11】中间件(Middleware):核心设计
java·人工智能·agent
2401_8856651934 分钟前
基于OpenCV的模板匹配OCR实战:银行卡与身份证数字识别完整教程
人工智能·python·opencv·计算机视觉·ocr
装不满的克莱因瓶35 分钟前
了解3D卷积原理——从空间感知到时空建模的深度学习核心算子
人工智能·pytorch·python·深度学习·机器学习·3d·ai
SuperHeroWu740 分钟前
【HarmonyOS 7】鸿蒙应用 AI Coding 工具链 DevEco Code 到 DevEco CLI
人工智能·华为·ai编程·harmonyos·cli·code