OpenBayes 教程上新丨仅激活 3B 参数可媲美 GPT-4o,Qwen3 深夜更新,一手实测来了!

今日凌晨,Qwen 团队再度公布重磅更新------此前已经广受好评的 Qwen3-30B-A3B 模型迎来了新版本:Qwen3-30B-A3B-Instruct-2507。机器学习爱好者 Vaibhav (VB) Srivastav 第一时间分享了使用反馈:「最新的 Qwen3-30B-A3B-2507 在搭载 MLX 的 Mac 上运行速度极快」。

聚焦官方给出的数据,这个非思考模式(non-thinking mode)的新模型,将长文本理解能力提升至 256K,仅激活 3B 参数,就能取得可媲美 Gemini 2.5-Flash(non-thinking)、GPT-4o 等顶尖闭源模型的超强性能。同时,其在指令跟随、逻辑推理、文本理解、数学、科学、编程及工具使用等方面均有显著提升。

目前,「一键部署 Qwen3-30B-A3B-Instruct-2507」已上线至 OpenBayes **公共教程中,一键克隆即可快速体验 demo。**小贝已经为大家进行了实测,询问北京多地区的暴雨和台风登陆上海这两个极端天气现象之间是否有关联,测试了这个非思考模式的模型,其迅速从多个角度给出了回答。

此外,我们还为新用户准备了惊喜算力资源福利,**使用邀请码「Qwen3-2507」注册即可获得 2 小时双卡 A6000 使用时长(资源有效期 1 个月),**数量有限,不要错过!

教程地址:

https://go.openbayes.com/G7u7K

Demo 运行

01 Demo 运行阶段

1.登录 OpenBayes,在「公共教程」页面,选择「一键部署 Qwen3-30B-A3B-Instruct-2507」教程。

2.页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

3.选择「NVIDIA RTX A6000-2」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。新用户使用下方邀请链接注册,可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费时长!

小贝总专属邀请链接(直接复制到浏览器打开):

https://go.openbayes.com/9S6Dr

4.等待分配资源,首次克隆需等待 2 分钟左右的时间。当状态变为「运行中」后,点击「API 地址」旁边的跳转箭头,即可跳转至 WebUI 页面。请注意,用户需在实名认证后才能使用 API 地址访问功能。

02 效果演示

1.最近极端天气频发,北京接连暴雨后,上海又迎来了台风,让我们来问问 Qwen3-30B-A3B-Instruct-2507 上海台风和北京暴雨的是否有关系,看看它怎么回答。

* 进入 API 后,若左上角不显示「Model」,这表示模型正在初始化,由于模型较大,请等待约 2-3 分钟后刷新页面即可。

2.该版本的模型是一个非思考模式(non-thinking mode)的新模型,从多个角度客观给出了分析。

相关推荐
小星AI1 分钟前
MCP协议超详细教程,从入门到实战
人工智能
小星AI2 分钟前
Kimi Code CLI 超详细教程,附源码
人工智能·agent
牧艺1 小时前
Cursor Rules / Skills 分层设计:让 Agent 像「团队新同事」
前端·人工智能·cursor
shepherd1111 小时前
一文带你掌握 LLM、Token、Context、Prompt、RAG、MCP、Skill、Agent 等 AI 核心概念
人工智能·后端·ai编程
小林ixn1 小时前
MCP 保姆级入门指南:AI 的“万能充电口”到底怎么玩?
人工智能
转转技术团队3 小时前
没有测试的核心代码,怎么交给 AI 重构
人工智能
爱读源码的大都督4 小时前
Claude Code源码分析(三):为什么系统提示词中需要有tools呢?
前端·人工智能·后端
半个落月5 小时前
LLM如何预测下一个Token?一文拆解Transformer核心流程
人工智能
触底反弹5 小时前
🔥 2026 年爆火的 Harness Engineering 到底是什么?从原理到实战一文讲透
javascript·人工智能·程序员