QWQ 32B 来了, 效果媲美DeepSeek 671B

3月6日,阿里云通义千问官方宣布推出最新推理模型QwQ-32B,这一模型仅有32B参数,相比传统指令调优模型,QwQ 具备思考和推理能力,在下游任务尤其是难题上能取得显著性能提升。QwQ-32B 是中型推理模型,能够与 DeepSeek-R1、o1-mini 等最先进的推理模型取得竞争性性能。 甚至在效果上与拥有671B参数的DeepSeek-R1相媲美。

根据官方披露的测试结果,QwQ-32B在多项关键评测中表现非常出色 ​​编辑​ 英智大模型推理API,在第一时间上线了QWQ-32B大模型, 欢迎大家前来使用, 访问网址:api.baystoneai.com/

下面我们来使用几个经典的问题来比较 官方DeepSeek 671B 与 QWQ-32B 模型的效果:

首先我们先在 cherry studio 中 配置 官网DeepSeek 671B模型 与 英智API 上线的 QWQ-32B的模型 ​​编辑​

按图配置好英智API的相关参数 ​​编辑​

按图配置好官网DeepSeek的相关参数

第一个问题 :三个开关分别对应楼上的三个灯泡,但你只能上楼一次。如何确定每个开关对应哪个灯泡?

​编辑​

2个模型的答案都是正确的, QWQ仅用了 1/3 的时间 就得出了正确答案

第二个问题: 一位商人有三块砝码,重量分别为 1kg、3kg 和 9kg。他需要利用这些砝码在天平上称量 1kg 到 13kg 之间的任何整数重量。

​编辑​

这个问题的逻辑性比较强, 从答案上QWQ明显更胜一筹, 在耗时上QWQ 也是仅用了 60%的时间

第三个问题: 详细阐述一下量子力学中的薛定谔方程在描述微观世界现象时的核心作用,以及它对现代科技如半导体技术、量子计算发展的影响。请用通俗易懂的语言解释复杂概念,并结合具体实例说明。 ​​编辑​ 从回答的内容上看 2个模型都表现的不错, 但QWQ32B的耗时明显少了一半。

根据以上3个问题的效果上来看, QWQ32B 模型 在某些方面 效果已经可以和DeepSeek 671B 媲美 甚至超越, 在性能方面那就是完全碾压了。 只需要更少的硬件配置就可以达到非常理想的效果。

相关推荐
AC赳赳老秦2 小时前
Unity游戏开发实战指南:核心逻辑与场景构建详解
开发语言·spring boot·爬虫·搜索引擎·全文检索·lucene·deepseek
且去填词3 小时前
DeepSeek-R1 实战:数据分析
人工智能·python·mysql·语言模型·deepseek·structured data
且去填词16 小时前
DeepSeek API 深度解析:从流式输出、Function Calling 到构建拥有“手脚”的 AI 应用
人工智能·python·语言模型·llm·agent·deepseek
AC赳赳老秦20 小时前
Shell 脚本批量生成:DeepSeek 辅助编写服务器运维自动化指令
运维·服务器·前端·vue.js·数据分析·自动化·deepseek
AC赳赳老秦1 天前
量化交易脚本开发:DeepSeek生成技术指标计算与信号触发代码
数据库·elasticsearch·信息可视化·流程图·数据库架构·memcached·deepseek
AC赳赳老秦2 天前
Python 爬虫进阶:DeepSeek 优化反爬策略与动态数据解析逻辑
开发语言·hadoop·spring boot·爬虫·python·postgresql·deepseek
Java后端的Ai之路2 天前
【大模型技术栈】-Qwen与DeepSeek如何构建智能大脑?
大模型·qwen·deepseek
AC赳赳老秦2 天前
Go语言微服务文档自动化生成:基于DeepSeek的智能解析实践
大数据·开发语言·人工智能·微服务·golang·自动化·deepseek
AC赳赳老秦3 天前
前端可视化组件开发:DeepSeek辅助Vue/React图表组件编写实战
前端·vue.js·人工智能·react.js·信息可视化·数据分析·deepseek
TGITCIC5 天前
mHC架构:用数学约束驯服超宽残差,大模型训练的新范式
ai大模型·开源大模型·deepseek·大模型ai·国产大模型·国产模型