一键部署丨DeepSeek-R1 新版本小幅升级便登顶开源王座,多项评测超越 Qwen3

近日,DeepSeek 官宣其 R1 模型进行「小幅」版本升级,发布 DeepSeek-R1-0528 。 在此次更新中,DeepSeek R1 通过提升计算资源配置并在后训练阶段引入算法优化机制,显著提升了其推理能力。该模型在数学、编程与通用逻辑等多项基准评测中表现出色,全面超越了 Qwen3-235B 和 DeepSeek-R1,堪称是「跨越一小步」便登顶开源王座。

DeepSeek-R1-0528 在多个基准测试中与主流模型的表现对比

更加值得一提的是,团队还蒸馏了 DeepSeek-R1-0528 的思维链(Chain-of-Thought),用于对 Qwen3-8B-Base 进行后训练,得到了 DeepSeek-R1-0528-Qwen3-8B 。 该模型在 AIME 2024 测试中达到了开源模型中的最新 SOTA(最先进)性能,较 Qwen3-8B 提升了 10.0%,并与 Qwen3-235B-thinking 的表现相当。

DeepSeek-R1-0528-Qwen3-8B 在各基准测试中与主流模型的表现对比

目前,「一键部署 DeepSeek-R1-0528-Qwen3-8B」已上线至 HyperAI 超神经官网的「教程」板块,快来体验吧!

教程地址:go.hyper.ai/uRzwv

Demo 运行

  1. 进入 hyper.ai 首页后,选择「教程」页面,并选择「一键部署 DeepSeek-R1-0528-Qwen3-8B」,点击「在线运行此教程」。
  1. 页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
  1. 选择「NVIDIA RTX 4090」以及「vllm」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。新用户使用下方邀请链接注册,可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费时长!

HyperAI 超神经专属邀请链接(直接复制到浏览器打开):

openbayes.com/console/sig...

  1. 等待分配资源,首次克隆需等待 2 分钟左右的时间。当状态变为「运行中」后,点击「API 地址」旁边的跳转箭头,即可跳转至 WebUI 页面。请注意,用户需在实名认证后才能使用 API 地址访问功能。

效果演示

端午节即将来临之际,又到了一年一度「甜咸大战」的时刻了,不如让我们来问问 DeepSeek-R1-0528-Qwen3-8B,看看它怎么回答 ⬇️

可以看到 DeepSeek-R1-0528-Qwen3-8B 会展示完整的思考过程,并且会从多个角度客观给出分析。

以上就是 HyperAI 超神经本次推荐的教程啦,感兴趣的小伙伴快来体验吧!教程地址:go.hyper.ai/uRzwv

相关推荐
hsg771 分钟前
简述:ResNet34/ResNet50及SENet改进模型
人工智能·深度学习
AI专业测评2 分钟前
【炼字工坊x番茄小说 网文风向标】 20260530期 最新题材指南和写作指导(新人必看)
人工智能·ai写作·网文
“码”力全开2 分钟前
深度解析:基于 Docker 与边缘计算的国产化 AI 视频管理平台,如何通过源码交付实现多协议(GB28181/RTSP)与异构算力解耦?
人工智能·docker·边缘计算
凯丨3 分钟前
实战 Claude 的 effort 参数:让智能体“按需用力“省 token(含 Opus 4.8 更新)
人工智能
captain_AIouo4 分钟前
攻克行业技术痛点,GPT Image2重塑电商AI生图标准
大数据·人工智能·经验分享·gpt·aigc
weixin_468466856 分钟前
图像分割新手入门:从环境搭建到实战应用
图像处理·人工智能·深度学习·计算机视觉·ai
Promise微笑7 分钟前
算法突围:“双核四驱”理论下的“官网”AI引用概率提升指南
人工智能·算法·chatgpt
一一哥Sun7 分钟前
第04课:生成式AI——从“读懂“到“创造“
人工智能
收放扳机7 分钟前
FPC卷料制程收放卷方案:PID张力控制与高精度纠偏的技术实践
人工智能·科技·自动化·制造·pcb工艺
公众号-老炮说Java8 分钟前
Spring AI Alibaba 硬核实战:Token 原理 → RAG → 多智能体,一篇通
java·人工智能·后端·spring