谷歌 Gemini 2.5 升级:对话指令驱动的智能图像分割

阿里通义发布 4800 亿参数 Qwen3-Coder 代码大模型 媲美 Claude Sonnet4

Qwen3-Coder-480B-A35B-Instruct[1] 是阿里通义团队最新发布的代码大模型。这款 MoE 架构模型拥有 480B 总参数,其中激活参数达 35B,原生支持 256K token 的超长上下文窗口,在代码生成和理解能力上可媲美 Claude Sonnet4。

使用方式超级简单:通过 npm 安装 @qwen-code/qwen-code 包,或者直接在 Claude Code 中配置代理就能用。

腾讯 CodeBuddy IDE 发布:支持 Claude/混元等多模型编程助手

腾讯也发布了一款 AI 编程IDE CodeBuddy[2],同样基于 VSCode 套壳的,支持 Claude、混元等多款主流大模型。

不过目前需要通过填写问卷获取邀请码才能体验。

谷歌 Gemini 2.5 升级:对话指令驱动的智能图像分割

谷歌的 Gemini 2.5 现已支持对话式语义图像分割功能。该功能能够通过理解复杂的自然语言指令(包括对象关系、条件逻辑和抽象概念)来精确识别和分割图像中的特定区域。

目前该功能已在 Google AI Studio 中开放免费试用。

可以在官方博客查看完整技术说明[3]

相关推荐
戴着眼镜看不清2 天前
2025年最新开源Nano Banana Plus商业化系统本地搭建教程
人工智能·gemini·nanobanana
Code_流苏3 天前
Gemini in Chrome深度解析:反垄断胜诉后,Chrome开启AI智能浏览时代!
前端·人工智能·chrome·gemini·智能时代·ai browser
小溪彼岸11 天前
Gemini CLI+传统CLI=提效助手
gemini
小溪彼岸11 天前
Google百万Token上下文Gemini CLI,离AI自由更近一步
google·gemini
路边闲人212 天前
vscode启用GEMINI CODE ASSIST插件
ide·vscode·gemini
iChochy13 天前
[开源免费] iGTTS(Gemini TTS) 文本转语音(TTS)的命令行工具。
python·tts·gemini
shao91851615 天前
Gradio全解11——Streaming:流式传输的视频应用(8)——Gemini Live API:实时音视频连接
人工智能·async·gemini·websockets·live api·servertoserver·clienttoserver
我没想到原来他们都是一堆坏人19 天前
通过Gen AI SDK调用gemini 2.5 pro,单独上传pdf文件 | ai agent 开发笔记 2025.9.2 Day 2
ai·google·pdf·sdk·gemini
GitLqr20 天前
AI洞察 | Hunyuan-MT 翻译模型开源,谷歌终端嵌入模型登场
github·ai编程·gemini
安替-AnTi20 天前
AI急速搭建网站:Gemini、Bolt或Jules、GitHub、Cloudflare Pages实战全流程!
ai·github·cloudflare·bolt·gemini·快速搭建网站