本周 AI 新动态精选(2026.06.08–06.14)

🔥 本周 AI 新动态精选(2026.06.08--06.14)

  1. 🤖 月之暗面 --- Kimi K2.7 Code(开源编程 LLM + 多模态)

• 核心能力:1T 参数 MoE 架构(激活 32B),原生支持 256K 上下文 + MoonViT 视觉编码器处理多模态输入;强制开启思维链推理,代码 Benchmark 提升 ~21.8%,推理 Token 消耗降 30%;API 同步上线,高速版推理提速 5--6×。

  1. ⚡ MiniMax --- M3 开源原生多模态模型 + MSA 稀疏注意力

• 核心能力:约 428B 总参数 MoE(激活 23B),原生融合文本/图像/视频训练;自研 MiniMax Sparse Attention 使 1M 上下文推理加速 28 倍,预填加速 9×、解码加速 15×,长文本 Agent 门槛大幅降低;权重已开源。

  1. 🧠 智谱 --- GLM-5.2 开源旗舰 + ZCode 3.0 Agent 编程工具

• 核心能力:744B MoE(激活 ~40B),真实可用 1M Token 长上下文,强化编程与复杂任务规划;配套 ZCode 3.0 切换自研 Agent 内核,支持分组任务工作区与智能知识库,MIT 协议开源免费商用。

  1. 🔧 小米 --- MiMo Code V0.1(开源 Coding Agent)+ MiMo-V2.5 多模态模型

• 核心能力:终端级 AI 编程 Agent,内置持久记忆 + Compose 模式,支持跨会话上下文与零成本迁移 Claude Code 配置;内置 MiMo-V2.5 多模态模型,专项适配代码理解、工具调用与任务规划。

  1. 🌐 谷歌 --- DiffusionGemma(开源扩散 LLM)+ Gemini-SQL2 API

• 核心能力:DiffusionGemma 26B MoE(激活 3.8B)采用并行扩散生成 256 Token,文本生成速度最高提 4×,适合代码补全与行内编辑;Gemini-SQL2(基于 Gemini 3.1 Pro)Text-to-SQL BIRD 基准准确率 80.04%,已开放 API 预览。

  1. 🎬 智源研究院 --- Emu3.5 多模态统一基座 + 腾讯混元 HPC-Ops 推理算子库

• 核心能力:Emu3.5 纯自回归统一架构,原生支持文本/图像/视频理解与生成;腾讯混元开源 HPC-Ops 推理算子库------Attention 动态调度长文本加速 2.95×,端到端 QPM 提升 17%,FusedMoE 较主流框架快 1.2--1.6×。

相关推荐
人工智能AI技术1 小时前
Loop Engineering彻底改写AI编程:不用手写提示词,让AI自主循环干活
人工智能
调试优选官1 小时前
2026上海AI搜索GEO优化服务商技术路径深度解析
人工智能·ai·geo·上海
麦cocc1 小时前
大模型的监督微调(Supervised Fine-Tuning, SFT)
人工智能·自然语言处理
坚持是一种态度1 小时前
Spring AI Demo - 多模型智能聊天应用
人工智能·spring boot
yyuuuzz1 小时前
云服务器软件部署的常见问题与经验
linux·运维·服务器·网络·数据库·人工智能·github
得一录1 小时前
LangGraph节点间数据传递的模式
人工智能
在路上走着走着1 小时前
OpenAI Function Calling
人工智能
小小高不懂写代码1 小时前
Transformer与注意力机制
前端·人工智能
码流怪侠1 小时前
【GitHub】 Headroom 深度解析:AI Agent 上下文压缩层的完整技术拆解
人工智能·github·agent