[250125] DeepSeek 发布开源大模型 R1,性能比肩 OpenAI o1 | 希捷推出高达 36TB 的硬盘

DeepSeek 发布开源大模型 R1,性能比肩 OpenAI o1

DeepSeek 正式发布了 DeepSeek-R1 大模型,并同步开源了模型权重,其性能对标 OpenAI o1 正式版。

🌟 主要亮点:

  • 开源模型,MIT 许可证:
    DeepSeek-R1 遵循 MIT License,允许用户自由使用、修改、分发,甚至商用, 并允许通过蒸馏技术基于 R1 训练其他模型。
  • API 开放调用:
    用户可以通过 DeepSeek API 调用 R1 模型,设置 model='deepseek-reasoner'即可体验其强大的推理能力,例如思维链输出。
  • 性能比肩 OpenAI o1:
    DeepSeek-R1 在后训练阶段大规模使用强化学习技术,在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
  • 蒸馏小模型开源,超越 OpenAI o1-mini:
    同时开源了 6 个基于 R1 蒸馏的小模型,其中 32B 和 70B 模型在多项能力上超越了 OpenAI o1-mini。
  • 开放的许可证和用户协议:
    模型开源采用 MIT License,产品协议明确允许用户进行模型蒸馏。
  • App 和网页端同步更新:
    用户可以通过 DeepSeek 官网或 App 的"深度思考"模式体验 R1 的能力。
  • API 定价:
    DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中), 每百万输出 tokens 16 元。

📚 技术细节:

DeepSeek-R1 在后训练阶段大量使用强化学习技术,在极少标注数据的情况下,大幅提升了模型的推理能力。 相 关训练技术已全部公开,论文链接:
https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

🤗HuggingFace 模型链接:
https://huggingface.co/deepseek-ai

🛠️API 调用指南:
https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

DeepSeek-R1 的发布及其开源,对开源社区和行业生态发展具有重要意义。其性能比肩 OpenAI o1,并提供了更开放的许可证和用户协议,降低了使用门槛,为开发者和研究者提供了更多选择。 同时,蒸馏小模型的开源也为资 源有限的用户提供了更轻量级的选择。 相信 DeepSeek-R1 的开源将进一步推动大模型技术的普及和应用。

来源:

https://api-docs.deepseek.com/zh-cn/news/news250120

希捷推出高达 36TB 的硬盘,扩展其基于 HAMR 的 Mozaic 3+ 技术平台

希捷科技近日宣布,已向特定客户交付容量高达 36TB 的 Exos M 硬盘样品。Exos M 基于希捷突破性的热辅助磁记录 (HAMR) 技术平台 Mozaic 3+,为大型数据中心部署提供了前所未有的存储规模。

🌟 要点:

  • 云服务提供商采用:
    希捷目前正将其 Exos M 硬盘的容量提升至 32TB,并与一家领先的云服务提供商进行批量出货。此外,希捷还在对基于 Exos M 平台的 36TB 硬盘进行样品测试。
  • Mozaic 3+ 和 HAMR 创新:
    Exos M 基于希捷的 Mozaic 3+ 技术平台,这是业界首个采用热辅助磁记录 (HAMR) 技术的平台。它为数据中心运营商提供了显著的规模、总体拥有成本 (TCO) 和可持续性优势,包括在相同数据中心占用空间内存储容量增加 300%,每 TB 成本降低 25%,以及每 TB 功耗降低 60%。
  • 无与伦比的面积密度:
    由基于 HAMR 的 Mozaic 3+ 平台提供支持的 Exos M,现在通过高效的 10 盘片产品设计提供高达 36TB 的容量点。希捷是目前唯一一家能够实现每张硬盘盘片 3.6TB 面积密度的数据存储公司,并有望将每盘片容量提升至 10TB。

希捷的 Exos M 硬盘和 Mozaic 3+ 平台代表了数据存储技术的重大进步,为应对不断增长的数据需求提供了高容量、低成本和可持续的解决方案。

来源:

https://www.seagate.com/cn/zh/news/news-archive/seagate-introduces-hard-drive-capacities-of-up-to-36tb-extending-its-hamr-based-mozaic-3-technology-platform-pr/

更多内容请查阅 : blog-250125

相关推荐
cg3320 小时前
cc-connect,十分钟帮你把 claude code 连接到微信,飞书,钉钉等等平台
后端·openai
神秘的猪头20 小时前
🔌 把 MCP 装进大脑!手把手带你构建能“热插拔”工具的 AI Agent
langchain·llm·mcp
树獭叔叔1 天前
08-大模型后训练的指令微调SFT:LoRA让大模型微调成本降低99%
后端·aigc·openai
智泊AI1 天前
一文讲清:Agent、Workflow、MCP的区别是啥?
llm
冬奇Lab1 天前
一天一个开源项目(第37篇):awesome-selfhosted - 自托管软件资源集合
开源·自动化运维·资讯
王小酱1 天前
Claude Code 创始人 Boris 揭秘:团队 10 倍效率技巧
openai·ai编程·aiops
冬奇Lab2 天前
一天一个开源项目(第36篇):EverMemOS - 跨 LLM 与平台的长时记忆 OS,让 Agent 会记忆更会推理
人工智能·开源·资讯
冬奇Lab2 天前
OpenClaw 源码深度解析(一):Gateway——为什么需要一个"中枢"
人工智能·开源·源码阅读
王小酱2 天前
结合OpenSpec 与 Everything-Claude-Code (ECC) 的构建团队工作流程
openai·ai编程·aiops