比Qwen3-Max更Max？夸克抢先用上最新闭源模型

最强搜索「牵手」最强模型，能碰撞出什么火花？

Qwen 最新闭源模型，让夸克先用上了。

10 月 23 日，一向不爱出风头的夸克上线了对话助手，可以让用户在一个 App 内即可完成信息查找、问题解答与任务处理，实现了 AI 搜索与对话的深度融合。

其中一大亮点就是，该对话助手采用了 Qwen 最新闭源模型。至于是哪个型号、性能有多强，夸克卖了个关子，只透露比 Qwen3-Max 更进一步，在业界有绝对领先性。

要知道，此前在云栖大会上惊艳亮相的 Qwen3-Max，一经发布就凭借超越 GPT-5 和 Claude Opus 4 的优异表现，跻身全球大模型前三甲。因此，我们有理由相信，夸克对话助手所采用的这款 Qwen 闭源模型，其性能将达到一个全新的高度。

得益于 Qwen 最新闭源模型的强推理、长文本理解能力，夸克对话助手能够快速、精准回答用户的提问，在处理复杂问题和多轮对话时表现更出色。

再加上夸克在搜索和工具领域的多年积累，以及自建的专业知识库，让该助手能够通过多链路实时检索，提供高质量、可溯源的信息，显著提高了回答的准确性和可信度，真正做到了「既聪明又可靠」。

目前，夸克对话助手已经全面上线，所有人只需下载最新夸克 APP 即可免费体验。

接下来，我们就来个深度评测，看看它在实际场景中的表现如何。

一手体验

先来看看它的王牌功能「AI 搜索」。

平时我「召唤」夸克最多的场景就是找网盘资源，现在有了夸克对话助手，找资源更是省时省力。比如我们让它找英语专八真题的夸克网盘资源，它立马就贴出资源合集链接，点一下即可保存至夸克网盘。

这两天 AI 圈闹得最沸沸扬扬的大事，非 Meta AI 裁员莫属，汪滔大手一挥干掉了 600 个岗位，其中 FAIR、AI 产品以及基础设施团队成了妥妥的裁员重灾区。

我们索性就让夸克对话助手扒下这事的来龙去脉。输入提示词，点开「深度搜索」，夸克对话助手搜索了 197 篇资料，并从中筛选出符合要求的 38 个参考信源，包括网易、搜狐、新浪新闻等，机器之心也赫然在列。

它的回答虽然言简意赅，但基本涵盖了关键的新闻事实，且条分缕析逻辑清楚，从裁员范围、原因、补偿到同期重大动作，再到行业影响，它给扒了个底朝天。

$上下滑动查看更多$

再来测测它的理解能力。

今年 6 月，莫言在广东惠州面对百年客家围屋碧滟楼有感而发，写下「从南阳到南洋根深叶茂」十字上联，并发出「向天下文友敬求下联」之邀。最近，该征集活动获奖名单揭晓，一 00 后女生凭「自井壁及井毕角亢星张」下联夺得一等奖。有网友称：没点传统文化知识还理解不了这个下联。

我们让夸克对话助手来解读下这副对联妙在哪。它抽丝剥茧分析得头头是道，不仅能理解上联中地理与历史的双线叙事，还能识别出下联中涉及的天文知识及典故，并由此延伸出这副对联所蕴含的天人合一的宇宙观。

$上下滑动查看更多$

至于写作能力，我们直接上传了一张图片，让它拿出所有本事，为此景写一首古诗。在这个过程中，夸克对话助手不仅要识别图像内容，还要从视觉信息中提炼出与之匹配的情感和意象，通过古诗的形式进行表达，而古诗又对文化和语言知识有着极高的要求，比如音韵和谐、对仗工整等。

$上下滑动查看更多$

我们还让它模仿「Sir 电影」公众号风格，为英剧《流人》第一季写一篇剧评。

夸克写的这篇剧评还是蛮符合「Sir 电影」的一贯风格，使用幽默解构与结构化叙事介绍了《流人》第一季故事情节，对于人物性格的捕捉和场景的描述尤为细致生动。可以这么说，再稍微润色下，加上几张剧照或者动图完全可以进行发布。

$上下滑动查看更多$

逻辑推理能力也是测评必不可少的。我们采用拍照搜题的形式，上传了一道图像推理题，夸克先是观察图形规律，继而进行分析、推理，最终选出了正确答案，整个过程既快又准。

此外，夸克还自建了医疗、教育、法律、财经等多个垂直知识库，通过结构化、标准化的专业数据训练，大幅增强了模型在专业领域的推理与专业理解能力。

比如我们拍一张老师作业批改记录的表格，输入提示词：提取一下表格。不到 10 秒，夸克对话助手就完成扫描、生成表格等一系列操作，即使是手写字体，它也能准确无误地识别，极大地提高了办公效率。

或者使用「打电话」功能，咨询一些医疗知识，比如腰疼怎么办？它能提供比较专业的回答并给出靠谱的解决方案。

总体来说，夸克这次算是最强模型和最强搜索的「双剑合璧」，与其他对话助手相比，夸克的回答更加严谨、有逻辑，内容风格也更接近于 ChatGPT。

技术解读

如今，市面上 AI 助手类产品层出不穷，虽然都宣称拥有智能对话、信息搜索等功能，但从本质上来说，AI 助手的核心竞争力仍然取决于其背后所依托的模型技术。不同的模型驱动了这些产品的智能化水平，而模型的先进性则直接决定了 AI 助手的实用性和用户体验。

作为新一代 AI 助手的代表，夸克对话助手背后的 Qwen 最新闭源模型无疑让它在众多竞争者中脱颖而出。尽管该款闭源模型仍保持神秘，但可以肯定的是，这款模型在多个维度上都展现出惊人的能力，并在全球都有绝对的领先性。

因为还没有这款最新闭源模型的更多信息，我们就以 Qwen3-Max 为例做参考。Qwen3-Max 模型预训练数据量达 36T tokens，总参数超过万亿，不仅在数学推理、复杂指令理解、长文本处理和多语言能力方面表现优异，还在编程和 Agent 工具调用等领域有着卓越的表现。

具体来说，在大模型用 Coding 解决真实世界问题的 SWE-Bench Verified 测试中，Qwen3-Max-Instruct 版本斩获 69.6 分，位列全球第一梯队；在评估智能体工具调用能力的严苛基准 Tau2-Bench 上，Instruct 版本更是实现了突破性表现，以 74.8 分超越 Claude Opus 4 与 DeepSeek-V3.1。不仅如此，Qwen3-Max-Thinking-Heavy 曾在 AIME25 和 HMMT 这两个数学评测榜单中拿下双满分，这可是国产大模型首次，直接证明了夸克 AI 助手领先的逻辑推理能力，让夸克能够在信息检索和任务处理过程中，快速且精准地理解用户意图，提供高质量的解答。

夸克对话助手的另一大优势则在于其技术架构上的创新。

众所周知，大模型有个最大的毛病，就是喜欢一本正经地胡说八道。为了提升答案的准确性和可信度，夸克采用了「模型 + 系统」的双轮驱动策略。基于阿里 Qwen 最新闭源模型，夸克自研了由实时信息检索、信源追溯和交叉验证组成的可信系统，以确保生成内容的来源可追溯、信息可验证，且支持用户进一步追问。

夸克算法团队与通义实验室还成立了专项联合研发小组，聚焦于「搜索推理」和「可信生成」两大核心领域，深度定制了一款更擅长搜索与信息甄别的专属模型，从根本上提升了生成内容的专业性与可靠性。

此外，夸克还自建了包括医疗、教育、法律、财经等在内的多个垂直领域的专业知识库，以此提升在特定领域的应用表现。这些知识库经过结构化、标准化处理，为夸克提供了丰富的行业知识，让它能够在健康咨询、学习辅导、法律解读、财经分析等核心场景中，能够提供更精准、更专业的解答。

结语

一直以来，阿里都秉持着「模型即应用」的战略。这个战略的核心，就是让 AI 从藏在幕后的技术工具，真正走到台前，成为用户可以直接感知、随时交互的应用本身。

夸克对话助手，正是这一战略的最佳注脚。它不是单纯在搜索引擎里加个对话框，而是用大模型重新定义了信息获取的方式，让搜索、问答、任务处理在同一个对话界面里无缝流转。用户不必在多个 App 之间反复切换，也无需纠结「这个问题该搜索还是该问 AI」，所有需求都在一次次对话中解决。

而这才是 AI 应用该有的样子。