谷歌 Gemini 2.5 升级：对话指令驱动的智能图像分割

三花AI2025-07-23 16:17

Qwen3-Coder-480B-A35B-Instruct $1$ 是阿里通义团队最新发布的代码大模型。这款 MoE 架构模型拥有 480B 总参数，其中激活参数达 35B，原生支持 256K token 的超长上下文窗口，在代码生成和理解能力上可媲美 Claude Sonnet4。

使用方式超级简单：通过 npm 安装 @qwen-code/qwen-code 包，或者直接在 Claude Code 中配置代理就能用。

腾讯也发布了一款 AI 编程IDE CodeBuddy $2$ ，同样基于 VSCode 套壳的，支持 Claude、混元等多款主流大模型。

不过目前需要通过填写问卷获取邀请码才能体验。

谷歌的 Gemini 2.5 现已支持对话式语义图像分割功能。该功能能够通过理解复杂的自然语言指令（包括对象关系、条件逻辑和抽象概念）来精确识别和分割图像中的特定区域。

目前该功能已在 Google AI Studio 中开放免费试用。

可以在官方博客查看完整技术说明 $3$