DeepSeek V3-0324深度实测:小小升级,巨大进步

前言

昨日(3月24日)深夜,DeepSeek 以"小版本升级"的名义悄然推出V3-0324模型。

尽管官方未高调宣传,但6850亿参数的规模、接近Claude 3.7的编程能力以及更宽松的MIT开源协议,让这次更新成为AI开源社区的现象级事件。

白天有点事情,没有第一时间测试,这就补上。

更新内容

  • 编程能力:前端代码生成质量达Claude 3.7同级,可完整实现复杂功能模块开发。
  • 数学推理:突破高等数学全领域解题,实现从计算到逻辑推理的跨越式升级。
  • 对话交互:上下文窗口从64K扩展至128K,支持更复杂的多轮对话。
  • 响应速度:新增快速响应模式,简单任务处理效率提升40%+且API无缝兼容。
  • 免费商用:采用MIT协议,允许商业场景免费使用,降低企业集成门槛。
  • 风格调整:输出风格转向技术化、专业化,弱化拟人化表达。

提升评测

相比较DeepSeek V3,DeepSeek V3-0324在多个评测指标中都有显著提升:

  • MMLU-Pro:从75.9提升至81.2(+5.3)
  • GPQA:从59.1跃升至68.4(+9.3)
  • AIME:实现最大幅度提升,从39.6飙升至59.4(+19.8)
  • LiveCodeBench:从39.2进步到49.2(+10.0)

DataLearnerAI 的大模型官方评测排行榜可以看出,明显超过 Claude 3.5。

数据来源:www.datalearner.com/ai-models/a...

实测

挑选了两个之前分享过的场景做个对比。

SVG生成

昨天刚分享了 Claude 3.7 生成SVG的效果,今天咱就对比下 DeepSeek V3-0324 效果如何。

从理科到文科的华丽转身:Claude 3.7轻松生成SVG图形,让你创作升级 - 掘金

Claude 3.7

V3-0324

V3

虽然有些细节没有到位,但整体效果其实已经非常可以了。

毕竟为了对比,我是一字未改的采用了 Claude 3.7 的提示词(针对Claude优化过的),如果针对 DeepSeek V3 稍微优化下,估计能够更加完善。

前端界面生成

DeepSeek V3-0324这次专门提到了前端效果生成提升,那我们也测试下。

Cursor实战:非前端人员实现工作台前端需求 - 掘金

Claude 3.7

V3-0324

确实很好,可以说和 Claude 3.7 不相上下。

V3 之前版本的效果就不放了,差距有点大。

V3-0324 免费 API

之前 DeepSeek 一直使用的硅基流动 API,但是今天尚未上线 V3-0324,为了给大家看效果,就去 DeepSeek 官网充值了。

结果,刚充值完,我就看到了一篇分享,OpenRouter 上V3-0324 免费,我...

分享给大家,大家可以免费体验去。

openrouter.ai/deepseek/de...

总结

通过实测,我们看到了 DeepSeek V3-0324 在生成SVG以及前端界面方面的表现确实很不错,平均下来也是Claude 3.6+ 的水平了。

甚至,考虑到我 V3 使用经验不够,它可能还有提升空间。

让我们期待下吧,希望 DeepSeek 未来持续进步,完全替代国外的模型,也让我们可以毫无留恋地转到完整的国内生态中。

加油~

相关推荐
cscshaha2 分钟前
《从零构建大语言模型》学习笔记1,环境配置
人工智能·深度学习·语言模型·llm·从零构建大语言模型
双翌视觉1 小时前
机械手的眼睛,视觉系统如何让机器人学会精准抓取
人工智能·机器人·自动化
IvanCodes2 小时前
OpenAI 最新开源模型 gpt-oss (Windows + Ollama/ubuntu)本地部署详细教程
人工智能·语言模型·chatgpt·开源
2301_769006782 小时前
祝贺!1464种期刊被收录,CSCD 核心期刊目录更新!(附下载)
大数据·数据库·人工智能·搜索引擎·期刊
天天代码码天天2 小时前
C# OnnxRuntime Yolov8 纸箱检测
人工智能
猫头虎-人工智能2 小时前
ChatGPT模型选择器详解:全面了解GPT-4o、GPT-4.5、o3等模型的切换与使用策略(2025最新版)
人工智能·chatgpt·开源·aigc·ai编程·ai写作·ai-native
小苏兮2 小时前
飞算JavaAI深度解析:专为Java生态而生的智能引擎
java·开发语言·人工智能·java开发·飞算javaai炫技赛
qdprobot2 小时前
齐护机器人小智AI_MCP图形化编程控制Arduino_ESP32
人工智能·机器人
Deepoch2 小时前
智能巡检机器人的进化:当传统巡检遇上Deepoc具身智能外拓开发板
人工智能·机器人
碳酸的唐2 小时前
MobileNetV3: 高效移动端深度学习的前沿实现
人工智能·深度学习