[250125] DeepSeek 发布开源大模型 R1,性能比肩 OpenAI o1 | 希捷推出高达 36TB 的硬盘

DeepSeek 发布开源大模型 R1,性能比肩 OpenAI o1

DeepSeek 正式发布了 DeepSeek-R1 大模型,并同步开源了模型权重,其性能对标 OpenAI o1 正式版。

🌟 主要亮点:

  • 开源模型,MIT 许可证:
    DeepSeek-R1 遵循 MIT License,允许用户自由使用、修改、分发,甚至商用, 并允许通过蒸馏技术基于 R1 训练其他模型。
  • API 开放调用:
    用户可以通过 DeepSeek API 调用 R1 模型,设置 model='deepseek-reasoner'即可体验其强大的推理能力,例如思维链输出。
  • 性能比肩 OpenAI o1:
    DeepSeek-R1 在后训练阶段大规模使用强化学习技术,在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
  • 蒸馏小模型开源,超越 OpenAI o1-mini:
    同时开源了 6 个基于 R1 蒸馏的小模型,其中 32B 和 70B 模型在多项能力上超越了 OpenAI o1-mini。
  • 开放的许可证和用户协议:
    模型开源采用 MIT License,产品协议明确允许用户进行模型蒸馏。
  • App 和网页端同步更新:
    用户可以通过 DeepSeek 官网或 App 的"深度思考"模式体验 R1 的能力。
  • API 定价:
    DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中), 每百万输出 tokens 16 元。

📚 技术细节:

DeepSeek-R1 在后训练阶段大量使用强化学习技术,在极少标注数据的情况下,大幅提升了模型的推理能力。 相 关训练技术已全部公开,论文链接:
https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

🤗HuggingFace 模型链接:
https://huggingface.co/deepseek-ai

🛠️API 调用指南:
https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

DeepSeek-R1 的发布及其开源,对开源社区和行业生态发展具有重要意义。其性能比肩 OpenAI o1,并提供了更开放的许可证和用户协议,降低了使用门槛,为开发者和研究者提供了更多选择。 同时,蒸馏小模型的开源也为资 源有限的用户提供了更轻量级的选择。 相信 DeepSeek-R1 的开源将进一步推动大模型技术的普及和应用。

来源:

https://api-docs.deepseek.com/zh-cn/news/news250120

希捷推出高达 36TB 的硬盘,扩展其基于 HAMR 的 Mozaic 3+ 技术平台

希捷科技近日宣布,已向特定客户交付容量高达 36TB 的 Exos M 硬盘样品。Exos M 基于希捷突破性的热辅助磁记录 (HAMR) 技术平台 Mozaic 3+,为大型数据中心部署提供了前所未有的存储规模。

🌟 要点:

  • 云服务提供商采用:
    希捷目前正将其 Exos M 硬盘的容量提升至 32TB,并与一家领先的云服务提供商进行批量出货。此外,希捷还在对基于 Exos M 平台的 36TB 硬盘进行样品测试。
  • Mozaic 3+ 和 HAMR 创新:
    Exos M 基于希捷的 Mozaic 3+ 技术平台,这是业界首个采用热辅助磁记录 (HAMR) 技术的平台。它为数据中心运营商提供了显著的规模、总体拥有成本 (TCO) 和可持续性优势,包括在相同数据中心占用空间内存储容量增加 300%,每 TB 成本降低 25%,以及每 TB 功耗降低 60%。
  • 无与伦比的面积密度:
    由基于 HAMR 的 Mozaic 3+ 平台提供支持的 Exos M,现在通过高效的 10 盘片产品设计提供高达 36TB 的容量点。希捷是目前唯一一家能够实现每张硬盘盘片 3.6TB 面积密度的数据存储公司,并有望将每盘片容量提升至 10TB。

希捷的 Exos M 硬盘和 Mozaic 3+ 平台代表了数据存储技术的重大进步,为应对不断增长的数据需求提供了高容量、低成本和可持续的解决方案。

来源:

https://www.seagate.com/cn/zh/news/news-archive/seagate-introduces-hard-drive-capacities-of-up-to-36tb-extending-its-hamr-based-mozaic-3-technology-platform-pr/

更多内容请查阅 : blog-250125

相关推荐
说私域2 小时前
“开源AI智能名片2+1链动模式S2B2C商城小程序源码”在市场推广中的应用与策略
人工智能·小程序·开源
CodeCodeBond4 小时前
RAG:实现基于本地知识库结合大模型生成(LangChain4j快速入门#1)
java·后端·ai·语言模型·langchain·个人开发·ai编程
Elastic 中国社区官方博客5 小时前
Elasticsearch:如何搜索含有复合词的语言
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
skywalk81637 小时前
飞桨PaddleNLP套件中使用DeepSeek r1大模型
人工智能·paddlepaddle·deepseek
远洋录9 小时前
AI Agent的多轮对话:提升用户体验的关键技巧
人工智能·ai·ai agent
AI服务老曹9 小时前
提供算法模型管理、摄像头管理、告警管理、数据统计等功能的智慧园区开源了
运维·人工智能·安全·开源
大模型之路10 小时前
深度解析 DeepSeek R1:强化学习与知识蒸馏的协同力量
人工智能·llm·deepseek·deepseek-v3·deepseek-r1
relis10 小时前
芯片AI深度实战:实战篇之vim chat
ai·vim·chat