谷歌 Gemini 2.5 升级:对话指令驱动的智能图像分割

阿里通义发布 4800 亿参数 Qwen3-Coder 代码大模型 媲美 Claude Sonnet4

Qwen3-Coder-480B-A35B-Instruct[1] 是阿里通义团队最新发布的代码大模型。这款 MoE 架构模型拥有 480B 总参数,其中激活参数达 35B,原生支持 256K token 的超长上下文窗口,在代码生成和理解能力上可媲美 Claude Sonnet4。

使用方式超级简单:通过 npm 安装 @qwen-code/qwen-code 包,或者直接在 Claude Code 中配置代理就能用。

腾讯 CodeBuddy IDE 发布:支持 Claude/混元等多模型编程助手

腾讯也发布了一款 AI 编程IDE CodeBuddy[2],同样基于 VSCode 套壳的,支持 Claude、混元等多款主流大模型。

不过目前需要通过填写问卷获取邀请码才能体验。

谷歌 Gemini 2.5 升级:对话指令驱动的智能图像分割

谷歌的 Gemini 2.5 现已支持对话式语义图像分割功能。该功能能够通过理解复杂的自然语言指令(包括对象关系、条件逻辑和抽象概念)来精确识别和分割图像中的特定区域。

目前该功能已在 Google AI Studio 中开放免费试用。

可以在官方博客查看完整技术说明[3]

相关推荐
CodeDevMaster3 天前
Gemini CLI使用教程:在命令行中释放AI的力量
llm·ai编程·gemini
数据知道9 天前
一文掌握Bard机器翻译,以及用python调用的4种方式(现已升级为 Gemini)
python·自然语言处理·bard·机器翻译·gemini
哪 吒14 天前
OpenAI放大招:ChatGPT学习模式上线,免费AI智能家教
人工智能·学习·ai·chatgpt·gemini·deepseek
技术老金16 天前
Gemini CLI 协作时总“失忆”?学会这招再也不用从头聊
gemini
POLOAPI18 天前
从模型到生产:AI 大模型落地工程与效率优化实践
人工智能·gpt·gemini
Humbunklung18 天前
C# WPF 实现读取文件夹中的PDF并显示其页数
pdf·c#·wpf·npoi·gemini·itext
LinXunFeng19 天前
AI - Gemini CLI 摆脱终端限制
openai·ai编程·gemini
哪 吒1 个月前
AI进入自动驾驶时代:OpenAI发布革命性ChatGPT Agent
人工智能·chatgpt·agent·claude·gemini·deepseek
mortimer1 个月前
用Gemini攻克小语种语音识别,生成广播级SRT字幕
人工智能·gemini