DeepSeek V3“小版本升级” 实测堪比 V3.5,非推理模型也有 “啊哈时刻”,7 米甘蔗过 2 米门想通了

DeepSeek V3 升级了,新版本 V3-0324。

官方轻描淡写只说是 "小版本升级",但很多人实测下来可一点也不小。

把流行的小球弹跳测试,提升难度到 4 维空间超立方体也没问题。

天哪,如果这只是一个小更新,那我想象不出大更新会是什么样子。

编程这块,只需一句提示词开发一个完整产品着陆页,带自适应布局带动效,被评价为与 Claude 3.7 Sonnet 同一水平。

由于发布时间太短,还没有正式测评结果,不过在开发者 Xeophon 的个人 Benchmark 上所有指标都有大提升,成为该测试下最好的非推理模型。

不是推理模型也有 "啊哈时刻"

DeepSeek-V3-0324 并非推理模型,在回答之前不会给出思考过程,但依然遵循一定的思维方式分解问题。

走入死胡同的话,还表现出自主回到上一步重新思考的能力。

在 "9.11 和 9.9 那个大"、"Straberry 有多少个 r" 已经不成问题的今天,最新折磨 AI 的难题是"让 7 米长的甘蔗通过 2 米高 1 米宽的门"。

在量子位的测试中,DeepSeek-V3-0324 先是像它的前辈以及许多其他 AI 一样碰壁。

碰壁之后开始重新思考题目本身的含义,后面依旧陷入误区,但突然在中文解题过程中夹杂一句英语思考,类似 DeepSeek-R1 技术报告中的 "啊哈时刻"

等等,这似乎与之前的对角线方法相似,也许我遗漏了什么。

顿悟之后,突然就走上了正确的道路,注意到了题目中没直接提到的隐藏条件。

虽然从计算过程看,还是没理解到问题的本质,但好歹得出了解决方案,还认识到了自己的误区。

依旧免费, 依旧开源

像这样的优秀模型依旧免费, 依旧开源,权重文件已火速上线 HuggingFace,使用最宽松的 MIT 协议。

所有权重文件加起来占硬盘空间约 688GB,与初代 v3 保持一致,说明依然是 671B 参数的 MoE 模型,目前没有更多技术细节,还需等待官方进一步发布公告。

目前在官网和官方 APP(关闭深度思考即可)、HuggingFace 等渠道都能体验到 v3-0324。

也可以到大模型竞技场去与其他模型 pk,不过投票结果还要等一段时间才能出来。

当然最让大家期待的还是,v3 更新了,r2 还会远吗?

官网试玩:

chat.deepseek.com/

HuggingFace:

huggingface.co/deepseek-ai...

参考链接:

1\][x.com/TheXeophon/...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2FTheXeophon%2Fstatus%2F1904225899957936314 "https://x.com/TheXeophon/status/1904225899957936314") \[2\][x.com/Yuchenj_UW/...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2FYuchenj_UW%2Fstatus%2F1904223627509465116 "https://x.com/Yuchenj_UW/status/1904223627509465116") \[3\][x.com/risphereedi...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2Frisphereeditor%2Fstatus%2F1904194061780590773 "https://x.com/risphereeditor/status/1904194061780590773") --- **完** ---

相关推荐
搞科研的小刘选手7 小时前
【高届数传感机电会议】第十二届传感器、机电一体化和自动化系统国际学术研讨会(ISSMAS 2026)
运维·人工智能·自动化·控制·传感器·传感·机电
治数有道7 小时前
AI时代下:降本增效的具象化诱惑
人工智能
一次旅行7 小时前
今日AI科技新闻总结
人工智能·科技
这张生成的图像能检测吗7 小时前
(论文速读)Sonnet:多变量时间序列预测的谱算子神经网络
人工智能·深度学习·时序预测·时序模型
地球资源数据云7 小时前
1900-2023年中国物种分布点位矢量数据集
大数据·数据结构·数据库·数据仓库·人工智能
littleM7 小时前
OpenClaw vs HermesAgent 对比分析系列
人工智能·架构·ai编程
AI医影跨模态组学7 小时前
Research(IF=10.9)南方医科大学珠江医院汪洋教授等团队:深度学习在脊柱MRI诊断中的应用:AI辅助与人工的多中心对比研究
人工智能·深度学习·论文·医学影像·影像组学
Zldaisy3d7 小时前
上交大特材所 l 增材制造多层级功能结构综述
人工智能
缝艺智研社7 小时前
誉财 YC - 16 POLO 衫智能自动钉扣机:POLO 衫钉扣新变革
人工智能·新人首发·自动化缝纫机·线上模板机·无人自动化产线
带电的小王7 小时前
【动手学深度学习】8.4. 循环神经网络
人工智能·pytorch·rnn·深度学习