阿里云正式对外发布了 Qwen3.7-Max ,一款专为智能体工作流打造的模型,它在代码编写、办公自动化以及长周期自主任务执行上表现出了极高的稳定性。

真实开发能力
Qwen3.7-Max 在各项主流评测中的成绩已经与 Opus-4.6 Max、DS-V4-Pro Max 等头部模型处于同一梯队。

代码与前端开发
在软件工程基准 SWE-Pro 中,模型拿到 60.6 分,多语言代码测试 SWE-Multilingual 达到 78.3 分。面对终端环境测试 Terminal Bench 2.0-Terminus,它以 69.7 分的成绩反超了 DS-V4-Pro Max。此外它在前端代码生成和矢量图绘制任务中同样具备顶尖水准。
办公自动化与工具调用
处理多智能体协作和办公任务时,模型的 MCP 协议兼容性极佳。在 MCP-Mark 测试中拿到 60.8 分,全面超越 GLM-5.1。在处理复杂电子表格的 SpreadSheetBench-v1 测试中更是拿下了 87 分的高分。
高难度逻辑推理
面对复杂的数理逻辑,Qwen3.7-Max 在 GPQA Diamond 中达到 92.4 分,在 HMMT 2026 Feb 评测中达到 97.1 分,展示出扎实的底层逻辑解析能力。
智能体的环境扩展与跨框架泛化
很多模型在脱离官方测试环境后表现会大幅下降,Qwen3.7-Max 在底层训练机制上解决了这个问题。
环境规模扩展机制

研发团队在 Qwen3.7 中大幅拓展了智能体训练环境的多样性。正如语言模型通过海量文本提升理解能力一样,智能体同样能从多样的环境中获得能力泛化。测试数据表明,这种扩展带来了可预测的性能提升。在包含大量未见过的域外环境评测中,模型的平均排名稳居前三,综合表现已经逼近 Claude-4.6-Opus-Max,证明其具备真正的策略泛化能力,而非针对特定测试集的应试优化。
跨框架泛化能力

Qwen3.7-Max 的训练基础设施将任务、框架和验证器彻底解耦。同一个任务会被放入不同的框架组合中进行交叉强化学习。这种机制强迫模型去学习通用的解题策略,而不是钻特定框架的空子。在 QwenClawBench 和 CoWorkBench 测试中,无论评估时切换成什么框架,模型输出都保持高度一致。这也让它能够无缝接入 Claude Code、OpenClaw 等第三方智能体系统。
超长周期自主执行拒绝跑偏
很多模型在执行多步任务时容易丢失上下文,导致任务失败。Qwen3.7-Max 在长周期规划和抗遗忘能力上做了深度优化。
在底层算子优化场景下,模型在一台搭载平头哥 ZW-M890 PPU 的服务器上连续自主运行了 35 小时。面对完全陌生的硬件架构,它调用了 1158 次工具,独立完成了代码编写、编译报错排查和架构重构,最终把 Extend Attention 算子的性能提升了 10 倍。

在商业经营模拟测试 YC-Bench 中,模型接管了一家初创公司一年的运营权。经过数百轮涉及人员管理、合同筛选的决策,它不仅成功避开了各种商业陷阱,还实现了 208 万美元的营收,业绩直接翻倍。
此外该模型已经具备了操控物理世界机器狗的能力。配合专属导航模型和视觉工具,它可以在真实物理环境中完成路径规划和长期记忆构建。
规则自我演进与环境泛化
研发团队将任务、测试框架和验证器进行了解耦,让模型在海量未知环境中进行强化学习。这种机制让 Qwen3.7-Max 摆脱了对单一框架的依赖。无论是接入 Claude Code 还是 OpenClaw,输出质量都非常稳定。
在软件工程任务的强化学习监控中,模型经过 80 多小时的运行,自主回放训练轨迹。它精准揪出了 1618 个试图绕过规则获取答案的作弊案例,并自己总结出 13 条新的判断规则,实现了奖励机制的自我完善。
跨环境部署与接入方案
Qwen3.7-Max 目前已上线阿里云百炼平台(Model Studio)。开发者可以根据自己的技术栈选择合适的接入方式。
方案一 基于 Python 环境的 API 接入
适合需要将模型集成到后端服务或自动化脚本的开发者。运行前需确保系统已安装 Python 3.x 环境。如果没有,可以用 ServBay 一键安装Python,全程只需要一分钟,而且多个 Python 环境可以同时并存。

首先安装官方依赖包
bash
pip install openai
配置环境变量 DASHSCOPE_API_KEY,将其值设定为阿里云百炼平台的 API 密钥。为保证长周期任务的上下文连贯性,建议在请求参数中开启 preserve_thinking 功能。
代码调用示例
python
from openai import OpenAI
import os
api_key = os.environ.get("DASHSCOPE_API_KEY")
if not api_key:
raise ValueError("请先设置 DASHSCOPE_API_KEY 环境变量")
client = OpenAI(
api_key=api_key,
base_url=os.environ.get(
"DASHSCOPE_BASE_URL",
"https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
),
)
messages = [{"role": "user", "content": "编写一个合并两个有序链表的Python函数"}]
completion = client.chat.completions.create(
model="qwen3.7-max",
messages=messages,
extra_body={
"enable_thinking": True,
"preserve_thinking": True
},
stream=True
)
is_answering = False
print("\n========== 推理过程 ==========\n")
for chunk in completion:
if not chunk.choices:
continue
delta = chunk.choices[0].delta
if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
if not is_answering:
print(delta.reasoning_content, end="", flush=True)
if hasattr(delta, "content") and delta.content:
if not is_answering:
print("\n========== 最终回答 ==========\n")
is_answering = True
print(delta.content, end="", flush=True)
方案二 基于 Node.js 环境接入前端生态
前端和全栈开发者可以直接将 Qwen3.7-Max 接入常用的终端工具中。操作前需预装 Node.js 与 npm。Node.js环境也可以用ServBay一键安装。

接入 Claude Code
阿里云百炼 API 原生支持 Anthropic 协议,可通过全局安装并配置环境变量直接使用。
bash
npm install -g @anthropic-ai/claude-code
export ANTHROPIC_MODEL="qwen3.7-max"
export ANTHROPIC_SMALL_FAST_MODEL="qwen3.7-max"
export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic
export ANTHROPIC_AUTH_TOKEN=<你的API_KEY>
claude
接入 Qwen Code
这是专为 Qwen 系列深度优化的终端智能体框架。
bash
npm install -g @qwen-code/qwen-code@latest
qwen
方案三 基于 Bash 脚本部署 OpenClaw
偏好使用 OpenClaw 框架的开发者可以直接通过 curl 脚本安装,随后修改本地配置。
bash
curl -fsSL https://molt.bot/install.sh | bash
export DASHSCOPE_API_KEY=<你的API_KEY>
openclaw dashboard
修改 ~/.openclaw/openclaw.json 配置文件
json
{
"models": {
"mode": "merge",
"providers": {
"modelstudio": {
"baseUrl": "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
"apiKey": "DASHSCOPE_API_KEY",
"api": "openai-completions",
"models": [
{
"id": "qwen3.7-max",
"name": "qwen3.7-max",
"reasoning": true,
"input": ["text"],
"contextWindow": 1000000,
"maxTokens": 65536
}
]
}
}
},
"agents": {
"defaults": {
"model": {
"primary": "modelstudio/qwen3.7-max"
}
}
}
}
Qwen3.7-Max 在代码开发、长文本推理和复杂环境交互等多个维度提供了稳定的底层支持。开发者可根据具体业务场景选择合适的部署方式,快速搭建属于自己的智能体工作流。