比Qwen3-Max更Max?夸克抢先用上最新闭源模型

最强搜索「牵手」最强模型,能碰撞出什么火花?

Qwen 最新闭源模型,让夸克先用上了。

10 月 23 日,一向不爱出风头的夸克上线了对话助手,可以让用户在一个 App 内即可完成信息查找、问题解答与任务处理,实现了 AI 搜索与对话的深度融合。

其中一大亮点就是,该对话助手采用了 Qwen 最新闭源模型。至于是哪个型号、性能有多强,夸克卖了个关子,只透露比 Qwen3-Max 更进一步,在业界有绝对领先性。

要知道,此前在云栖大会上惊艳亮相的 Qwen3-Max,一经发布就凭借超越 GPT-5 和 Claude Opus 4 的优异表现,跻身全球大模型前三甲。因此,我们有理由相信,夸克对话助手所采用的这款 Qwen 闭源模型,其性能将达到一个全新的高度。

得益于 Qwen 最新闭源模型的强推理、长文本理解能力,夸克对话助手能够快速、精准回答用户的提问,在处理复杂问题和多轮对话时表现更出色。

再加上夸克在搜索和工具领域的多年积累,以及自建的专业知识库,让该助手能够通过多链路实时检索,提供高质量、可溯源的信息,显著提高了回答的准确性和可信度,真正做到了「既聪明又可靠」。

目前,夸克对话助手已经全面上线,所有人只需下载最新夸克 APP 即可免费体验。

接下来,我们就来个深度评测,看看它在实际场景中的表现如何。

一手体验

先来看看它的王牌功能「AI 搜索」。

平时我「召唤」夸克最多的场景就是找网盘资源,现在有了夸克对话助手,找资源更是省时省力。比如我们让它找英语专八真题的夸克网盘资源,它立马就贴出资源合集链接,点一下即可保存至夸克网盘。

这两天 AI 圈闹得最沸沸扬扬的大事,非 Meta AI 裁员莫属,汪滔大手一挥干掉了 600 个岗位,其中 FAIR、AI 产品以及基础设施团队成了妥妥的裁员重灾区。

我们索性就让夸克对话助手扒下这事的来龙去脉。输入提示词,点开「深度搜索」,夸克对话助手搜索了 197 篇资料,并从中筛选出符合要求的 38 个参考信源,包括网易、搜狐、新浪新闻等,机器之心也赫然在列。

它的回答虽然言简意赅,但基本涵盖了关键的新闻事实,且条分缕析逻辑清楚,从裁员范围、原因、补偿到同期重大动作,再到行业影响,它给扒了个底朝天。

[ 上下滑动查看更多 ]

再来测测它的理解能力。

今年 6 月,莫言在广东惠州面对百年客家围屋碧滟楼有感而发,写下「从南阳到南洋根深叶茂」十字上联,并发出「向天下文友敬求下联」之邀。最近,该征集活动获奖名单揭晓,一 00 后女生凭「自井壁及井毕角亢星张」下联夺得一等奖。有网友称:没点传统文化知识还理解不了这个下联。

我们让夸克对话助手来解读下这副对联妙在哪。它抽丝剥茧分析得头头是道,不仅能理解上联中地理与历史的双线叙事,还能识别出下联中涉及的天文知识及典故,并由此延伸出这副对联所蕴含的天人合一的宇宙观。

[ 上下滑动查看更多 ]

至于写作能力,我们直接上传了一张图片,让它拿出所有本事,为此景写一首古诗。在这个过程中,夸克对话助手不仅要识别图像内容,还要从视觉信息中提炼出与之匹配的情感和意象,通过古诗的形式进行表达,而古诗又对文化和语言知识有着极高的要求,比如音韵和谐、对仗工整等。

[ 上下滑动查看更多 ]

我们还让它模仿「Sir 电影」公众号风格,为英剧《流人》第一季写一篇剧评。

夸克写的这篇剧评还是蛮符合「Sir 电影」的一贯风格,使用幽默解构与结构化叙事介绍了《流人》第一季故事情节,对于人物性格的捕捉和场景的描述尤为细致生动。可以这么说,再稍微润色下,加上几张剧照或者动图完全可以进行发布。

[ 上下滑动查看更多 ]

逻辑推理能力也是测评必不可少的。我们采用拍照搜题的形式,上传了一道图像推理题,夸克先是观察图形规律,继而进行分析、推理,最终选出了正确答案,整个过程既快又准。

此外,夸克还自建了医疗、教育、法律、财经等多个垂直知识库,通过结构化、标准化的专业数据训练,大幅增强了模型在专业领域的推理与专业理解能力。

比如我们拍一张老师作业批改记录的表格,输入提示词:提取一下表格。不到 10 秒,夸克对话助手就完成扫描、生成表格等一系列操作,即使是手写字体,它也能准确无误地识别,极大地提高了办公效率。

或者使用「打电话」功能,咨询一些医疗知识,比如腰疼怎么办?它能提供比较专业的回答并给出靠谱的解决方案。

总体来说,夸克这次算是最强模型和最强搜索的「双剑合璧」,与其他对话助手相比,夸克的回答更加严谨、有逻辑,内容风格也更接近于 ChatGPT。

技术解读

如今,市面上 AI 助手类产品层出不穷,虽然都宣称拥有智能对话、信息搜索等功能,但从本质上来说,AI 助手的核心竞争力仍然取决于其背后所依托的模型技术。不同的模型驱动了这些产品的智能化水平,而模型的先进性则直接决定了 AI 助手的实用性和用户体验。

作为新一代 AI 助手的代表,夸克对话助手背后的 Qwen 最新闭源模型无疑让它在众多竞争者中脱颖而出。尽管该款闭源模型仍保持神秘,但可以肯定的是,这款模型在多个维度上都展现出惊人的能力,并在全球都有绝对的领先性。

因为还没有这款最新闭源模型的更多信息,我们就以 Qwen3-Max 为例做参考。Qwen3-Max 模型预训练数据量达 36T tokens,总参数超过万亿,不仅在数学推理、复杂指令理解、长文本处理和多语言能力方面表现优异,还在编程和 Agent 工具调用等领域有着卓越的表现。

具体来说,在大模型用 Coding 解决真实世界问题的 SWE-Bench Verified 测试中,Qwen3-Max-Instruct 版本斩获 69.6 分,位列全球第一梯队;在评估智能体工具调用能力的严苛基准 Tau2-Bench 上,Instruct 版本更是实现了突破性表现,以 74.8 分超越 Claude Opus 4 与 DeepSeek-V3.1。不仅如此,Qwen3-Max-Thinking-Heavy 曾在 AIME25 和 HMMT 这两个数学评测榜单中拿下双满分,这可是国产大模型首次,直接证明了夸克 AI 助手领先的逻辑推理能力,让夸克能够在信息检索和任务处理过程中,快速且精准地理解用户意图,提供高质量的解答。

夸克对话助手的另一大优势则在于其技术架构上的创新。

众所周知,大模型有个最大的毛病,就是喜欢一本正经地胡说八道。为了提升答案的准确性和可信度,夸克采用了「模型 + 系统」的双轮驱动策略。基于阿里 Qwen 最新闭源模型,夸克自研了由实时信息检索、信源追溯和交叉验证组成的可信系统,以确保生成内容的来源可追溯、信息可验证,且支持用户进一步追问。

夸克算法团队与通义实验室还成立了专项联合研发小组,聚焦于「搜索推理」和「可信生成」两大核心领域,深度定制了一款更擅长搜索与信息甄别的专属模型,从根本上提升了生成内容的专业性与可靠性。

此外,夸克还自建了包括医疗、教育、法律、财经等在内的多个垂直领域的专业知识库,以此提升在特定领域的应用表现。这些知识库经过结构化、标准化处理,为夸克提供了丰富的行业知识,让它能够在健康咨询、学习辅导、法律解读、财经分析等核心场景中,能够提供更精准、更专业的解答。

结语

一直以来,阿里都秉持着「模型即应用」的战略。这个战略的核心,就是让 AI 从藏在幕后的技术工具,真正走到台前,成为用户可以直接感知、随时交互的应用本身。

夸克对话助手,正是这一战略的最佳注脚。它不是单纯在搜索引擎里加个对话框,而是用大模型重新定义了信息获取的方式,让搜索、问答、任务处理在同一个对话界面里无缝流转。用户不必在多个 App 之间反复切换,也无需纠结「这个问题该搜索还是该问 AI」,所有需求都在一次次对话中解决。

而这才是 AI 应用该有的样子。

相关推荐
阿里云大数据AI技术4 小时前
阿里云DLF 3.0:面向AI时代的智能全模态湖仓管理平台
大数据·人工智能
Theodore_10224 小时前
机器学习(8)梯度下降的实现与过拟合问题
人工智能·深度学习·机器学习·计算机视觉·线性回归
苍何5 小时前
谁能想到快手也开始卷AI编程了?上手体验了下,有点东西!
人工智能
星期天要睡觉5 小时前
LangChain:让大模型具备思考与行动能力的框架
人工智能
被放养的研究生5 小时前
常见神经网络
人工智能·深度学习·神经网络
Sincerelyplz5 小时前
【Apps SDK】OpenAI推出的Chatgpt与外部应用集成的工具
后端·openai·agent
youcans_5 小时前
【医学影像 AI】一种用于生成逼真的3D血管的分层部件生成模型
论文阅读·人工智能·计算机视觉·3d·生成模型
软件测试小仙女5 小时前
AI驱动的测试:Cypress的cy.prompt功能实践
自动化测试·软件测试·人工智能·测试工具·cypress·ai测试·测试计划
文火冰糖的硅基工坊5 小时前
[人工智能-大模型-21]:“AI 编程工作流”模板(含 prompt 示例)
人工智能·科技·学习·大模型·prompt