Qwen3.7-Max 发布,全能智能体基座

阿里云正式对外发布了 Qwen3.7-Max ,一款专为智能体工作流打造的模型,它在代码编写、办公自动化以及长周期自主任务执行上表现出了极高的稳定性。

真实开发能力

Qwen3.7-Max 在各项主流评测中的成绩已经与 Opus-4.6 Max、DS-V4-Pro Max 等头部模型处于同一梯队。

代码与前端开发

在软件工程基准 SWE-Pro 中,模型拿到 60.6 分,多语言代码测试 SWE-Multilingual 达到 78.3 分。面对终端环境测试 Terminal Bench 2.0-Terminus,它以 69.7 分的成绩反超了 DS-V4-Pro Max。此外它在前端代码生成和矢量图绘制任务中同样具备顶尖水准。

办公自动化与工具调用

处理多智能体协作和办公任务时,模型的 MCP 协议兼容性极佳。在 MCP-Mark 测试中拿到 60.8 分,全面超越 GLM-5.1。在处理复杂电子表格的 SpreadSheetBench-v1 测试中更是拿下了 87 分的高分。

高难度逻辑推理

面对复杂的数理逻辑,Qwen3.7-Max 在 GPQA Diamond 中达到 92.4 分,在 HMMT 2026 Feb 评测中达到 97.1 分,展示出扎实的底层逻辑解析能力。

智能体的环境扩展与跨框架泛化

很多模型在脱离官方测试环境后表现会大幅下降,Qwen3.7-Max 在底层训练机制上解决了这个问题。

环境规模扩展机制

研发团队在 Qwen3.7 中大幅拓展了智能体训练环境的多样性。正如语言模型通过海量文本提升理解能力一样,智能体同样能从多样的环境中获得能力泛化。测试数据表明,这种扩展带来了可预测的性能提升。在包含大量未见过的域外环境评测中,模型的平均排名稳居前三,综合表现已经逼近 Claude-4.6-Opus-Max,证明其具备真正的策略泛化能力,而非针对特定测试集的应试优化。

跨框架泛化能力

Qwen3.7-Max 的训练基础设施将任务、框架和验证器彻底解耦。同一个任务会被放入不同的框架组合中进行交叉强化学习。这种机制强迫模型去学习通用的解题策略,而不是钻特定框架的空子。在 QwenClawBench 和 CoWorkBench 测试中,无论评估时切换成什么框架,模型输出都保持高度一致。这也让它能够无缝接入 Claude Code、OpenClaw 等第三方智能体系统。

超长周期自主执行拒绝跑偏

很多模型在执行多步任务时容易丢失上下文,导致任务失败。Qwen3.7-Max 在长周期规划和抗遗忘能力上做了深度优化。

在底层算子优化场景下,模型在一台搭载平头哥 ZW-M890 PPU 的服务器上连续自主运行了 35 小时。面对完全陌生的硬件架构,它调用了 1158 次工具,独立完成了代码编写、编译报错排查和架构重构,最终把 Extend Attention 算子的性能提升了 10 倍。

在商业经营模拟测试 YC-Bench 中,模型接管了一家初创公司一年的运营权。经过数百轮涉及人员管理、合同筛选的决策,它不仅成功避开了各种商业陷阱,还实现了 208 万美元的营收,业绩直接翻倍。

此外该模型已经具备了操控物理世界机器狗的能力。配合专属导航模型和视觉工具,它可以在真实物理环境中完成路径规划和长期记忆构建。

规则自我演进与环境泛化

研发团队将任务、测试框架和验证器进行了解耦,让模型在海量未知环境中进行强化学习。这种机制让 Qwen3.7-Max 摆脱了对单一框架的依赖。无论是接入 Claude Code 还是 OpenClaw,输出质量都非常稳定。

在软件工程任务的强化学习监控中,模型经过 80 多小时的运行,自主回放训练轨迹。它精准揪出了 1618 个试图绕过规则获取答案的作弊案例,并自己总结出 13 条新的判断规则,实现了奖励机制的自我完善。

跨环境部署与接入方案

Qwen3.7-Max 目前已上线阿里云百炼平台(Model Studio)。开发者可以根据自己的技术栈选择合适的接入方式。

方案一 基于 Python 环境的 API 接入

适合需要将模型集成到后端服务或自动化脚本的开发者。运行前需确保系统已安装 Python 3.x 环境。如果没有,可以用 ServBay 一键安装Python,全程只需要一分钟,而且多个 Python 环境可以同时并存。

首先安装官方依赖包

bash 复制代码
pip install openai

配置环境变量 DASHSCOPE_API_KEY,将其值设定为阿里云百炼平台的 API 密钥。为保证长周期任务的上下文连贯性,建议在请求参数中开启 preserve_thinking 功能。

代码调用示例

python 复制代码
from openai import OpenAI
import os

api_key = os.environ.get("DASHSCOPE_API_KEY")
if not api_key:
    raise ValueError("请先设置 DASHSCOPE_API_KEY 环境变量")

client = OpenAI(
    api_key=api_key,
    base_url=os.environ.get(
        "DASHSCOPE_BASE_URL",
        "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
    ),
)

messages = [{"role": "user", "content": "编写一个合并两个有序链表的Python函数"}]

completion = client.chat.completions.create(
    model="qwen3.7-max",
    messages=messages,
    extra_body={
        "enable_thinking": True,
        "preserve_thinking": True
    },
    stream=True
)

is_answering = False
print("\n========== 推理过程 ==========\n")

for chunk in completion:
    if not chunk.choices:
        continue
    delta = chunk.choices[0].delta

    if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
        if not is_answering:
            print(delta.reasoning_content, end="", flush=True)

    if hasattr(delta, "content") and delta.content:
        if not is_answering:
            print("\n========== 最终回答 ==========\n")
            is_answering = True
        print(delta.content, end="", flush=True)

方案二 基于 Node.js 环境接入前端生态

前端和全栈开发者可以直接将 Qwen3.7-Max 接入常用的终端工具中。操作前需预装 Node.js 与 npm。Node.js环境也可以用ServBay一键安装。

接入 Claude Code

阿里云百炼 API 原生支持 Anthropic 协议,可通过全局安装并配置环境变量直接使用。

bash 复制代码
npm install -g @anthropic-ai/claude-code

export ANTHROPIC_MODEL="qwen3.7-max"
export ANTHROPIC_SMALL_FAST_MODEL="qwen3.7-max"
export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic
export ANTHROPIC_AUTH_TOKEN=<你的API_KEY>

claude

接入 Qwen Code

这是专为 Qwen 系列深度优化的终端智能体框架。

bash 复制代码
npm install -g @qwen-code/qwen-code@latest
qwen

方案三 基于 Bash 脚本部署 OpenClaw

偏好使用 OpenClaw 框架的开发者可以直接通过 curl 脚本安装,随后修改本地配置。

bash 复制代码
curl -fsSL https://molt.bot/install.sh | bash
export DASHSCOPE_API_KEY=<你的API_KEY>
openclaw dashboard

修改 ~/.openclaw/openclaw.json 配置文件

json 复制代码
{
  "models": {
    "mode": "merge",
    "providers": {
      "modelstudio": {
        "baseUrl": "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
        "apiKey": "DASHSCOPE_API_KEY",
        "api": "openai-completions",
        "models": [
          {
            "id": "qwen3.7-max",
            "name": "qwen3.7-max",
            "reasoning": true,
            "input": ["text"],
            "contextWindow": 1000000,
            "maxTokens": 65536
          }
        ]
      }
    }
  },
  "agents": {
    "defaults": {
      "model": {
        "primary": "modelstudio/qwen3.7-max"
      }
    }
  }
}

Qwen3.7-Max 在代码开发、长文本推理和复杂环境交互等多个维度提供了稳定的底层支持。开发者可根据具体业务场景选择合适的部署方式,快速搭建属于自己的智能体工作流。

相关推荐
KeepPush1 小时前
Python JSON 完全指南:从基础到实战,掌握数据交换核心技能
后端
Cosolar1 小时前
深度测评 | QoderWork:当 AI 不再只是"聊天搭子",而是真能帮你干活的桌面智能体
人工智能·后端·程序员
前端Hardy1 小时前
21.8 万周下载!这个 React 表格组件,10 行代码就能跑起来
前端·javascript·后端
七牛开发者1 小时前
周三头条|从 Claude 案例看 Coding Agent 的计划层设计
ai编程
用户8356290780512 小时前
使用 Python 在 Word 文档中添加和管理脚注
后端
字节跳动数据库2 小时前
一个请求稳定的一生
后端·程序员
RainCity2 小时前
Java Swing 自定义组件库分享(十一)
java·笔记·后端
CoCo的编程之路2 小时前
2026全栈演进:使用前端开发助手进行项目重构的最佳工具
大数据·前端·人工智能·ai编程·comate
CriticalThinking3 小时前
在 JetBrains IDE 中通过 ACP 协议集成 Claude Code等外部工具
ide·agent·ai编程