谷歌 Gemini 2.5 升级:对话指令驱动的智能图像分割

阿里通义发布 4800 亿参数 Qwen3-Coder 代码大模型 媲美 Claude Sonnet4

Qwen3-Coder-480B-A35B-Instruct[1] 是阿里通义团队最新发布的代码大模型。这款 MoE 架构模型拥有 480B 总参数,其中激活参数达 35B,原生支持 256K token 的超长上下文窗口,在代码生成和理解能力上可媲美 Claude Sonnet4。

使用方式超级简单:通过 npm 安装 @qwen-code/qwen-code 包,或者直接在 Claude Code 中配置代理就能用。

腾讯 CodeBuddy IDE 发布:支持 Claude/混元等多模型编程助手

腾讯也发布了一款 AI 编程IDE CodeBuddy[2],同样基于 VSCode 套壳的,支持 Claude、混元等多款主流大模型。

不过目前需要通过填写问卷获取邀请码才能体验。

谷歌 Gemini 2.5 升级:对话指令驱动的智能图像分割

谷歌的 Gemini 2.5 现已支持对话式语义图像分割功能。该功能能够通过理解复杂的自然语言指令(包括对象关系、条件逻辑和抽象概念)来精确识别和分割图像中的特定区域。

目前该功能已在 Google AI Studio 中开放免费试用。

可以在官方博客查看完整技术说明[3]

相关推荐
魁首9 天前
为什么 Claude/Gemini/Codex 都用 stdio 传输机制?
claude·gemini·mcp
魁首16 天前
MCP与ACP本质区别深度分析
claude·gemini·mcp
魁首17 天前
初识 MCP (Model Context Protocol)
claude·gemini·mcp
戴着眼镜看不清25 天前
2025年最新开源Nano Banana Plus商业化系统本地搭建教程
人工智能·gemini·nanobanana
Code_流苏1 个月前
Gemini in Chrome深度解析:反垄断胜诉后,Chrome开启AI智能浏览时代!
前端·人工智能·chrome·gemini·智能时代·ai browser
小溪彼岸1 个月前
Gemini CLI+传统CLI=提效助手
gemini
小溪彼岸1 个月前
Google百万Token上下文Gemini CLI,离AI自由更近一步
google·gemini
路边闲人21 个月前
vscode启用GEMINI CODE ASSIST插件
ide·vscode·gemini
iChochy1 个月前
[开源免费] iGTTS(Gemini TTS) 文本转语音(TTS)的命令行工具。
python·tts·gemini
shao9185161 个月前
Gradio全解11——Streaming:流式传输的视频应用(8)——Gemini Live API:实时音视频连接
人工智能·async·gemini·websockets·live api·servertoserver·clienttoserver