[250125] DeepSeek 发布开源大模型 R1,性能比肩 OpenAI o1 | 希捷推出高达 36TB 的硬盘

DeepSeek 发布开源大模型 R1,性能比肩 OpenAI o1

DeepSeek 正式发布了 DeepSeek-R1 大模型,并同步开源了模型权重,其性能对标 OpenAI o1 正式版。

🌟 主要亮点:

  • 开源模型,MIT 许可证:
    DeepSeek-R1 遵循 MIT License,允许用户自由使用、修改、分发,甚至商用, 并允许通过蒸馏技术基于 R1 训练其他模型。
  • API 开放调用:
    用户可以通过 DeepSeek API 调用 R1 模型,设置 model='deepseek-reasoner'即可体验其强大的推理能力,例如思维链输出。
  • 性能比肩 OpenAI o1:
    DeepSeek-R1 在后训练阶段大规模使用强化学习技术,在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
  • 蒸馏小模型开源,超越 OpenAI o1-mini:
    同时开源了 6 个基于 R1 蒸馏的小模型,其中 32B 和 70B 模型在多项能力上超越了 OpenAI o1-mini。
  • 开放的许可证和用户协议:
    模型开源采用 MIT License,产品协议明确允许用户进行模型蒸馏。
  • App 和网页端同步更新:
    用户可以通过 DeepSeek 官网或 App 的"深度思考"模式体验 R1 的能力。
  • API 定价:
    DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中), 每百万输出 tokens 16 元。

📚 技术细节:

DeepSeek-R1 在后训练阶段大量使用强化学习技术,在极少标注数据的情况下,大幅提升了模型的推理能力。 相 关训练技术已全部公开,论文链接:
https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

🤗HuggingFace 模型链接:
https://huggingface.co/deepseek-ai

🛠️API 调用指南:
https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

DeepSeek-R1 的发布及其开源,对开源社区和行业生态发展具有重要意义。其性能比肩 OpenAI o1,并提供了更开放的许可证和用户协议,降低了使用门槛,为开发者和研究者提供了更多选择。 同时,蒸馏小模型的开源也为资 源有限的用户提供了更轻量级的选择。 相信 DeepSeek-R1 的开源将进一步推动大模型技术的普及和应用。

来源:

https://api-docs.deepseek.com/zh-cn/news/news250120

希捷推出高达 36TB 的硬盘,扩展其基于 HAMR 的 Mozaic 3+ 技术平台

希捷科技近日宣布,已向特定客户交付容量高达 36TB 的 Exos M 硬盘样品。Exos M 基于希捷突破性的热辅助磁记录 (HAMR) 技术平台 Mozaic 3+,为大型数据中心部署提供了前所未有的存储规模。

🌟 要点:

  • 云服务提供商采用:
    希捷目前正将其 Exos M 硬盘的容量提升至 32TB,并与一家领先的云服务提供商进行批量出货。此外,希捷还在对基于 Exos M 平台的 36TB 硬盘进行样品测试。
  • Mozaic 3+ 和 HAMR 创新:
    Exos M 基于希捷的 Mozaic 3+ 技术平台,这是业界首个采用热辅助磁记录 (HAMR) 技术的平台。它为数据中心运营商提供了显著的规模、总体拥有成本 (TCO) 和可持续性优势,包括在相同数据中心占用空间内存储容量增加 300%,每 TB 成本降低 25%,以及每 TB 功耗降低 60%。
  • 无与伦比的面积密度:
    由基于 HAMR 的 Mozaic 3+ 平台提供支持的 Exos M,现在通过高效的 10 盘片产品设计提供高达 36TB 的容量点。希捷是目前唯一一家能够实现每张硬盘盘片 3.6TB 面积密度的数据存储公司,并有望将每盘片容量提升至 10TB。

希捷的 Exos M 硬盘和 Mozaic 3+ 平台代表了数据存储技术的重大进步,为应对不断增长的数据需求提供了高容量、低成本和可持续的解决方案。

来源:

https://www.seagate.com/cn/zh/news/news-archive/seagate-introduces-hard-drive-capacities-of-up-to-36tb-extending-its-hamr-based-mozaic-3-technology-platform-pr/

更多内容请查阅 : blog-250125

相关推荐
SEO_juper20 小时前
大型语言模型SEO(LLM SEO)完全手册:驾驭搜索新范式
人工智能·语言模型·自然语言处理·chatgpt·llm·seo·数字营销
堆栈future1 天前
我的个人网站上线了,AI再一次让我站起来了
程序员·llm·aigc
即兴小索奇1 天前
CodePerfAI体验:AI代码性能分析工具如何高效排查性能瓶颈、优化SQL执行耗时?
ai·商业·ai商业洞察·即兴小索奇
NocoBase1 天前
6 个替代 Jira 的开源项目管理工具推荐
低代码·开源·github
新智元1 天前
刚刚,光刻机巨头 ASML 杀入 AI!豪掷 15 亿押注「欧版 OpenAI」,成最大股东
人工智能·openai
机器之心1 天前
全球图生视频榜单第一,爱诗科技PixVerse V5如何改变一亿用户的视频创作
人工智能·openai
大模型教程1 天前
AI Agent 发展趋势与架构演进
程序员·llm·agent
新智元1 天前
2025年了,AI还看不懂时钟!90%人都能答对,顶尖AI全军覆没
人工智能·openai
即兴小索奇1 天前
Codeium:免费开源代码自动补全工具,高效管理代码片段告别开发卡壳
ai·商业·ai商业洞察·即兴小索奇
机器之心1 天前
Claude不让我们用!国产平替能顶上吗?
人工智能·openai