QWQ 32B 来了, 效果媲美DeepSeek 671B

3月6日,阿里云通义千问官方宣布推出最新推理模型QwQ-32B,这一模型仅有32B参数,相比传统指令调优模型,QwQ 具备思考和推理能力,在下游任务尤其是难题上能取得显著性能提升。QwQ-32B 是中型推理模型,能够与 DeepSeek-R1、o1-mini 等最先进的推理模型取得竞争性性能。 甚至在效果上与拥有671B参数的DeepSeek-R1相媲美。

根据官方披露的测试结果,QwQ-32B在多项关键评测中表现非常出色 ​​编辑​ 英智大模型推理API,在第一时间上线了QWQ-32B大模型, 欢迎大家前来使用, 访问网址:api.baystoneai.com/

下面我们来使用几个经典的问题来比较 官方DeepSeek 671B 与 QWQ-32B 模型的效果:

首先我们先在 cherry studio 中 配置 官网DeepSeek 671B模型 与 英智API 上线的 QWQ-32B的模型 ​​编辑​

按图配置好英智API的相关参数 ​​编辑​

按图配置好官网DeepSeek的相关参数

第一个问题 :三个开关分别对应楼上的三个灯泡,但你只能上楼一次。如何确定每个开关对应哪个灯泡?

​编辑​

2个模型的答案都是正确的, QWQ仅用了 1/3 的时间 就得出了正确答案

第二个问题: 一位商人有三块砝码,重量分别为 1kg、3kg 和 9kg。他需要利用这些砝码在天平上称量 1kg 到 13kg 之间的任何整数重量。

​编辑​

这个问题的逻辑性比较强, 从答案上QWQ明显更胜一筹, 在耗时上QWQ 也是仅用了 60%的时间

第三个问题: 详细阐述一下量子力学中的薛定谔方程在描述微观世界现象时的核心作用,以及它对现代科技如半导体技术、量子计算发展的影响。请用通俗易懂的语言解释复杂概念,并结合具体实例说明。 ​​编辑​ 从回答的内容上看 2个模型都表现的不错, 但QWQ32B的耗时明显少了一半。

根据以上3个问题的效果上来看, QWQ32B 模型 在某些方面 效果已经可以和DeepSeek 671B 媲美 甚至超越, 在性能方面那就是完全碾压了。 只需要更少的硬件配置就可以达到非常理想的效果。

相关推荐
belingud12 小时前
不同模型回答差异的简单探讨
chatgpt·claude·deepseek
云道轩2 天前
DeepSeek补全IBM MQ 9.4 REST API 执行命令的PPT
deepseek·ibm mq
算家计算2 天前
DeepSeek R2因芯片问题再次延迟发布!千亿级大模型训练的算力之困
人工智能·芯片·deepseek
AI大模型3 天前
手把手教你本地部署DeepSeek:解锁私有化AI的无限可能
程序员·llm·deepseek
量子位3 天前
被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了
openai·deepseek
Spider_Man5 天前
和AI畅聊不掉线:本地部署LLM聊天界面全攻略
javascript·llm·deepseek
Chaos_Wang_6 天前
ShadowKV 机制深度解析:高吞吐长上下文 LLM 推理的 KV 缓存“影子”方案
人工智能·语言模型·自然语言处理·chatgpt·deepseek
玄明Hanko7 天前
DeepSeek是不是名不副实?
人工智能·deepseek
知了一笑7 天前
AI编程:代码多,效果好?
人工智能·大模型·kimi·千问·deepseek