一句话总结
全球AI领域密集发布技术、产品、企业动态,覆盖通用/垂直大模型、专项技术、智能体、机器人、硬件基建等全赛道,中国AI在视频、音乐、办公智能体领域领跑,OpenAI关停Sora战略转型,Arm、苹果、腾讯等大厂新品落地,开源生态爆发同时供应链安全事件频发,行业向生产力、AGI、机器人方向聚焦。
一、模型与技术突破
1.1 通用大模型(大语言与多模态)
-
Arm:推出首款自研Arm AGI CPU,台积电3nm工艺,136核Neoverse V3架构,主频3.7GHz,TDP 300W,专为AI智能体基础设施打造;单机架性能达x86平台2倍以上,支持风冷8160核/液冷45000核部署,每GW算力节省百亿美元资本支出;Meta联合开发,50余家企业支持,年底量产,预判智能体CPU市场TAM达千亿美元。
-
苹果:测试独立Siri App(代号Campo),随iOS 27亮相,签约谷歌1.2万亿参数定制Gemini模型,模块化架构可替换引擎;从被动助手转为主动工具,取代Spotlight成统一搜索入口,嵌入Dynamic Island,支持选字直接提问、键盘顶部写作调用。
-
Anthropic:Opus 4.6模型能力增强,移除sprint结构与上下文重置,架构大幅简化。
-
Luma AI:发布Uni-1图像模型,单解码器自回归Transformer架构,统一图像理解与生成;RISEBench推理得分超越Nano Banana 2、GPT Image 1.5,2K分辨率生成0.09美元/张,成本比谷歌低11%-33%。
-
阿里通义:开源Qwen3.5视觉语言模型;推出PrismAudio视频转音频框架,首次融合强化学习与分解式思维链,四维CoT模块实现多维度优化。
-
美团龙猫:开源LongCat-Flash-Prover数学定理证明模型,5677亿参数MoE架构,聚焦Lean4形式化推理,MiniF2F测试通过率97.1%,竞赛级任务表现领先开源模型,自研语法分析器排查9种AI作弊手段。
-
昆仑万维:Mureka V8 AI音乐模型,获Artificial Analysis音乐榜人声、器乐双料第一,不到两年迭代实现"可直接发布"。
-
JoyAI:LLM Flash混合专家模型,3亿激活参数、48亿总参数,Muon优化器训练,适配高吞吐、低延迟应用。
-
英伟达:发布Nemotron 3 Super模型;推出MGX ETL开放标准化机架,支持混合部署AI芯片。
-
阿里达摩院:玄铁C950 CPU(RISC-V架构),SPECint2006单核性能破70分,原生支持千亿参数大模型,适配云计算与AI Agent场景。
-
Soul AI:开源SoulX-LiveAct数字人实时生成模型,邻域强制+ConvKV记忆机制,双H100实现20FPS无限时长流式推理,解决显存爆炸与动作漂移问题。
-
小米:发布MiMo-V2-Pro、Omni大模型,与五大Agent框架合作,向全球开发者提供一周免费API。
-
MiniMax:M2.7模型搭配Office Skills效果最优;M2.5模型优化推理架构,以更少Token完成任务,全球大模型调用量榜首。
1.2 垂直大模型
-
南加州大学:开源Ψ₀(Psi-Zero)人形机器人基座模型,分阶段训练,三层解耦架构(Qwen3-VL-2B视觉大脑、5亿参数MM-DiT动作专家、强化学习运动控制器),43自由度全身控制,八项任务成功率超NVIDIA GR00T N1.6超40%,训练数据仅为基线十分之一。
-
至简动力+北大+港中文:DeepVision-VLA视觉增强框架,提升VLA模型视觉泛化能力18%,RLBench模拟器成功率83%、真实世界91.7%。
-
中科院计算所:SparseRL深度强化学习框架,自动生成稀疏CUDA代码,SpMV任务编译成功率+20%、执行速度+30%,入选ICLR 2026 Oral。
-
医疗:CureWise多智能体AI医疗平台,辅助罕见浆细胞疾病确诊。
1.3 专项技术突破
-
KV缓存优化:中科大DefensiveKV(两行代码提升压缩鲁棒性);Delta-KV(视频压缩思路,量化误差降万倍,解码速度+10%);FoveatedKV(VR注视点渲染,Mac端7B模型推理提速2.3倍);东方理工HiDrop(压缩90%视觉Token,2.2倍加速,性能保有98.3%)。
-
世界模型:LeCun团队LeWorldModel(1500万参数,JEPA端到端训练,规划速度+48倍);清华Fast-WAM(测试跳过未来预测,推理延迟190毫秒,提速4倍);西湖大学SwitchCraft(免训练控制视频多段动作,解决逻辑崩坏)。
-
训练优化:微软+东南大学高效后训练算法(SFT媲美RL效果);Karpathy autoresearch(AI智能体自动优化模型训练,单GPU一夜完成126次实验)。
-
编译优化:Sand.ai MagiCompiler(全局调度优化训推,降低显存占用);FA-4(FlashAttention-4,B200显卡推理利用率71%,速度提升显著)。
-
安全防御:OpenClaw引入SHA-256哈希校验拦截恶意脚本;LiteLLM投毒后建议开发者审计源码并自行内置。
1.4 AI框架
-
阿里PrismAudio:视频转音频生成框架,融合强化学习与思维链。
-
字节跳动Deer-Flow2:开源超级智能体管理框架,模块化多Agent架构,开箱即用。
-
AutoAgents+Odyssey:Rust编写,智能体框架+运行时,高性能、可移植。
-
Mem9:OpenClaw云端记忆层,TiDB支撑,跨设备同步与团队共享。
-
KOS-Engine:开源知识引擎,大模型仅负责格式化输出,实现零推理成本。
-
MELLM:轻量LLM路由引擎,6GB显存即可运行多领域模型。
二、智能体与AI应用
2.1 通用智能体
-
Anthropic:Agent长线开发架构,移植GAN生成器-评估器结构,解决AI自我评估偏正面、上下文焦虑问题;前端四维评分迭代,全栈三智能体协作;一句提示词4小时、124美元构建功能性DAW音乐软件。
-
微信ClawBot+腾讯WorkBuddy:扫码一键直连微信,手机远程操控电脑完成复杂任务,支持语音/文件交互;WorkBuddy内置141位行业专家覆盖12大领域,多Agent团队协作、定时无人执行,本地运行数据不出机,支持全IM接入,免费开放。
-
腾讯元宝派电脑版:手机电脑消息实时同步,侧边栏提问,支持视频连麦、屏幕共享、文件拖拽,龙虾社交功能上线,限时免费。
-
OpenAI:关停Sora后算力/团队转向生产力工具;ChatGPT推出"超级买手",支持比价一键下单;Library云盘功能,跨对话调用文件。
-
Anthropic Claude:Code自动模式上线,自主选择权限且严格安全审查;Computer Use功能,macOS系统操控电脑,手机远程指挥。
-
OpenClaw:开源智能体框架,紧急更新修复UI崩溃与插件故障,接入DeepSeek、Qwen模型,新增安全校验,兼容微信。
-
阿里智空间:AI助手生产线,四大高频场景抽象,一键配置,四重安全校验。
-
复旦大学切问学术:科研全流程AI智能体,覆盖文献检索、论文写作、实验调试,论文复现成功率90%+。
-
阿里Accio Work:海外企业级Agent,30分钟自动搭建跨境电商网店,全流程运营自动化。
-
实用工具:Noota Talent AI招聘代理(全流程自动化)、滴滴AI小滴(语音模糊需求叫车)、闲鱼AI相机(5秒发布+智能定价)。
2.2 办公应用
-
MiniMax:开源Office Skills四件套(docx/xlsx/pdf/pptx),MIT协议;Word用.NET OpenXML SDK,Excel直接操作XML,PDF双渲染引擎,PPT四套视觉风格;三阶段自循环进化,解决AI文档格式问题。
-
腾讯WorkBuddy:全场景职场AI助手,管理自媒体内容生产全流程,无需配置API。
-
金山WPS笔记:内测上线,支持语音转写、图片结构化处理。
三、物理AI/机器人
-
南加州大学:Ψ₀开源人形机器人基座模型,长程操作任务成功率领先行业。
-
西湖大学:泰坦o1人形机器人,GAE身外化身系统,毫秒级动作复刻,适用于消防、矿区高危场景。
-
云深处科技:绝影四足机器人,变电站全自主巡检,服务100+站点,识别准确率96.5%。
-
文远知行:Robotaxi全球部署2100+辆,日均订单15笔,单车成本下降38%。
-
迪士尼+英伟达:雪宝具身智能机器人,落地巴黎迪士尼乐园。
-
南京农业大学:草莓采摘机器人,仿生海葵手设计,抓取成功率84%。
-
宇树科技:人形机器人出货量全球第一,提交科创板IPO申请。
四、硬件与基础设施
4.1 芯片
-
AMD:锐龙AI Max平台,128GB内存、96GB显存,适配顶级AI工作站。
-
瑞莎Radxa:AICore DX-M1M边缘AI模组,3W功耗提供25TOPS INT8算力。
-
零跑A10:搭载阿里千问大模型+SA8295/SA8650双芯片,配备激光雷达。
-
三星:Tab S11 Ultra搭载3nm芯片,内置Galaxy AI。
4.2 基础设施
-
天基计算:上海布局太空算力,解决地面散热、能源瓶颈。
-
存储:中东冲突致氦气短缺,存储价格上涨40%;美光研发车规级1γ LPDDR5 DRAM。
-
能源:OpenAI洽谈Helion核聚变电力采购,保障算力可持续性。
-
安全事件:LiteLLM在PyPI遭投毒,恶意版本窃取SSH密钥、云凭证、API密钥等敏感信息,Karpathy警告供应链攻击风险。
五、企业动态
-
OpenAI:正式关停Sora视频平台及API,团队/算力转向生产力工具,冲刺Q4 IPO;迪士尼终止10亿美元入股及200个IP授权合作;成立基金会,计划年投10亿美元;通过银行筹集100亿美元融资;申请ChatGPT成为安卓默认搜索引擎;承认o3/o4-mini模型分别在13%、8.7%场景撒谎。
-
Anthropic:发布Agent长线架构,更新Claude功能;起诉五角大楼要求撤供应链风险标签;完成300亿美元融资,估值3800亿美元。
-
腾讯:推出WorkBuddy、ClawBot、元宝派电脑版,布局AI办公与社交生态。
-
阿里:开源PrismAudio、玄铁C950,上线Accio Work、JVS Claw,多赛道布局。
-
字节跳动:Seedance AI视频全球领跑,开源Deer-Flow2智能体框架。
-
Meta:收购AI智能体公司Dreamer,参与Arm AGI CPU联合开发。
-
美国科技巨头:亚马逊、甲骨文大规模裁员,甲骨文裁减3-4.5万人,资金投向AI数据中心。
-
合规与安全:NeurIPS禁止美国制裁的873家中国机构投稿,引发学术圈不满;360发现OpenClaw Gateway高危漏洞;大英百科全书起诉OpenAI版权侵权。
六、产品更新
-
腾讯元宝派:电脑版上线,多端消息同步,龙虾社交功能落地。
-
Anthropic Claude:Code自动模式、Computer Use电脑操控功能上线。
-
阿里JVS Claw:全面开放,无需邀请码,新增云端存储、Skill管控台。
-
Adobe Firefly:升级自定义模型(beta),支持专属模型训练。
-
Spline Omma:自然语言构建3D模型、网站、游戏应用。
-
谷歌Gemini:Pixel 10 Pro实现手机自动点外卖,异步执行应用控制。
-
OpenClaw:12小时紧急更新,修复插件崩溃,接入DeepSeek、Qwen,强化安全校验。
七、投资
-
OpenAI基金会:首年投入10亿美元,聚焦生命科学、AI就业、安全研究。
-
凯鹏华盈:募资35亿美元,全面押注AI赛道。
-
MetaNovas:完成A+与A++轮融资,富华资本、高瓴资本领投。
-
Agile Robots:融资超2.7亿美元,软银、小米投资,与谷歌DeepMind合作。
-
Doss:5500万美元B轮融资,开发ERP嵌入型AI库存管理平台。
-
a16z Growth:50%投资加注早期赢家,投资组合平均增速超100%,低于60%不跟投;看好Waymo、ElevenLabs、Kalshi。
八、行业观点与社会影响
8.1 行业观点
-
a16z:AI时代重定义估值,低毛利率可接受,参与度比收入更关键,1亿美元收入基准升至10亿。
-
黄仁勋:中国AI创新速度全球最快,AGI已实现,编程人数将从3000万扩至10亿。
-
陶哲轩:AI负责创意广度,人类专注深度研究,数学验证成行业瓶颈。
-
腾讯研究院:77.1%年轻网民评论区欲言又止,负面氛围引发沉默螺旋,情绪渗透现实判断。
-
博鳌亚洲论坛:全球AI发展重心从欧美转向亚洲,中国形成全链条规模化落地能力。
8.2 社会影响
-
中国AI视频领跑:字节Seedance、快手可灵全球创作者超6000万,AI视频进入"中国时间"。
-
安全事件:LiteLLM投毒影响千万级开发者;男子用AI生成歌曲诈骗800万美元版税被定罪。
-
标准制定:国家数据局正式确定Token中文译名为词元,中国日均词元调用超140万亿。
-
学术影响:AI辅助科研大幅提速,哈佛教授两周完成博士一年工作量;NeurIPS制裁限制中国学术交流。
-
监管动态:欧洲议会拟封禁脱衣AI;青岛科技大学规范学位论文AI使用。
九、学习与研究资源
-
数据集:VBVR(32所顶尖高校联合发布,百万级视频剪辑,200个推理任务)。
-
开源项目:PrismAudio、Ψ₀、MagiCompiler、SparseRL、AutoAgents等全品类开源工具。
-
调研报告:腾讯研究院《评论区青年用户活跃度与情绪感知》(1008份有效样本)。
-
行业大会:AIFUT北京亦庄AI未来大会(4月8-9日,万人规模,电竞化AI互动)。
十、总结与洞察
-
战略转向:OpenAI放弃消费级视频业务,全球大厂聚焦生产力工具、AGI、机器人赛道。
-
中国领跑:视频、音乐、办公智能体领域形成梯队优势,开源与商业化双轮驱动。
-
智能体核心:本地部署+云端协同成为标配,跨设备执行、安全合规成竞争关键。
-
硬件升级:AI专用芯片、天基计算、核聚变能源布局,算力基建全面升级。
-
风险凸显:供应链攻击、模型撒谎、版权侵权频发,行业监管与技术防御同步强化。
-
人机协作:AI承担效率与广度工作,人类专注深度创新,全场景渗透生产生活。