💡 今日趋势速览:OpenAI CEO Altman 确认 GPT-5.6 将以有限预览方式发布,联邦政府首次对 AI 模型实施逐客户审批管控,开创政府放行先例。与此同时,开源阵营持续发力,Ornith-1.0 聚焦代理编程场景,提供可本地部署的系列模型。
🎯 今日要点
📋 今日内容汇总
🤖 AI动态
- Altman 内部会:GPT-5.6 将有限预览
- Ornith-1.0 发布开源代理编程 LLM 系列
- 360 周鸿祎发布「倚天屠龙」AI 安全计划
- OpenAI 的各个部门正在被 AI 代理彻底改变。在我们...
- Gemini 3.5 Flash 原生整合 Computer Use
- Anthropic指控阿里巴巴使用数千个欺诈账户非法访问其模型
🔌 AI基础设施
🧪 芯片半导体
🦾 机器人具身智能
📌 模型排行榜
🤖 AI动态
1. Altman 内部会:GPT-5.6 将有限预览
OpenAI CEO Altman 在内部 Q&A 透露,GPT-5.6 将以「有限预览」方式发布,仅向小部分合作伙伴开放;原因是联邦政府要求逐个客户审批访问权限,创下 AI 模型由政府管控放行的先例,反映 AI 监管进入逐客审批时代。


2. Ornith-1.0 发布开源代理编程 LLM 系列
Ornith-1.0 发布开源代理编程 LLM 系列,涵盖 9B 到 397B 参数规模,在 Terminal-Bench、SWE-Bench 等编码基准测试中达到最先进性能。该模型基于 gemma4 和 qwen3.5 后训练,采用强化学习联合优化脚手与解决方案,全部以 MIT 许可发布,支持商业和研究用途。


3. 360 周鸿祎发布「倚天屠龙」AI 安全计划
360 集团周鸿祎在第十四届互联网安全大会上发布「倚天屠龙」AI 安全计划,推出对标 Anthropic MCP 的安全产品,聚焦 AI 智能体的数据安全与权限管控,应对大模型时代的安全威胁。


4. OpenAI 的各个部门正在被 AI 代理彻底改变。在我们...
OpenAI 的工作正在被代理彻底改变,涵盖每个部门。 在我们整个公司,人们正在使用 Codex 处理更复杂、运行时间更长、越来越需要跨职能协作的工作。 我们的内部使用提供了一个早期视角,展示代理工具如何在变得更加智能和广泛可用时重塑工作方式。



5. Gemini 3.5 Flash 原生整合 Computer Use
谷歌将 Computer Use 作为内置工具直接整合进 Gemini 3.5 Flash,原生集成后开发者可直接通过 Gemini API 调用,无需再调用专门的 Gemini 2.5 电脑操控模型,成为主力模型的默认能力,OSWorld 基准得 78.4,与 GPT-5.5 性能相当。


6. Anthropic指控阿里巴巴使用数千个欺诈账户非法访问其模型
Anthropic指控阿里巴巴使用数千个欺诈账户非法访问其Claude AI模型。 该投诉凸显了大规模提取和潜在滥用模型输出的行为。这引发了关于AI安全、数据保护和行业竞争行为的新问题。

🔌 AI基础设施
7. AI 军备竞赛的隐形瓶颈是电力基础设施
AI 算力竞赛的胜负关键并非芯片与模型,而是隐藏在背后的电力基础设施。当前 AI 用电需求激增,电网容量、变电站与冷却系统成为新的瓶颈,决定数据中心能否真正落地扩张。

🧪 芯片半导体
8. 苹果 M6 跳过高端版,主推 M7 AI 芯片
苹果计划最早今年推出入门级 Mac 用的基础款 M6 处理器,但将史无前例地跳过 M6 高端版本,并于 2027 年直接推出侧重 AI 能力的 M7 芯片,战略转向 AI 性能优先。

9. IBM 全球首款 0.7 纳米芯片技术发布
IBM 发布全球首款 0.7 纳米芯片技术,采用三维「纳米堆叠」架构,将晶体管节点推进至 0.7 纳米,半导体正式迈入「埃米时代」,有望突破物理极限延续摩尔定律。

🦾 机器人具身智能
10. 智元机器人 8 台人形机器人平板工厂上岗
智元机器人在南昌一条真实平板工厂生产线上,8 台人形机器人与人类工人协作完成早上 8 点到晚上 7 点的标准轮班。直播显示其效率已达人类速度,连续运行 6 天稳定可靠。


📌 模型排行榜
11. Artificial Analysis AI 模型能力排行榜
最后是今日的 AI 模型能力排行榜单,闭源方面,Claude Fable 5虽尚未开放、Claude Opus 4.8、GPT-5.5与Gemini 3.5 Flash在三项榜单中交替领跑,Anthropic在智能体场景保持领先,OpenAI在代码能力上略胜一筹,差距已不足2分,竞争已呈白热化。



以上是今天的AI 风向标,欢迎在评论区提出建议,我们明天见。