DeepSeek-R1 模型现已在亚马逊云科技上提供

2025年3月10日更新---DeepSeek-R1现已作为完全托管的无服务器模型在Amazon Bedrock上提供。

2025年2月5日更新---DeepSeek-R1 Distill Llama 和 Qwen模型现已在Amazon Bedrock Marketplace和Amazon SageMaker JumpStart中提供。

在最近的Amazon re:Invent大会上,亚马逊 CEO安迪·贾西分享了公司在开发近1000个生成式 AI 应用程序过程中获得的重要经验。基于这一大规模 AI 部署的实践,贾西提出了三个关键观察,这些观察塑造了亚马逊在企业 AI 实施方面的策略。

首先,随着生成式 AI 应用程序的规模扩大,计算成本变得至关重要。人们对更高的性价比有着极大的需求。其次,构建一个真正出色的生成式 AI 应用程序其实非常困难。第三,当我们让开发者自由选择他们想要使用的工具时,模型的多样性就显现出来。这一点并不让我们感到意外,因为我们一再吸取同样的教训:永远不会有一个工具能够统治整个 AI 领域。

正如安迪所强调的,亚马逊提供的广泛而深入的模型系列使客户能够选择最适合其独特需求的精准能力。通过密切关注客户需求和技术发展,亚马逊云科技定期扩展我们精选的模型库,既包括成熟行业宠儿,也囊括前景广阔的新兴模型。这种高性能和差异化模型产品的持续扩展,帮助客户保持在 AI 创新最前沿。

这让我们将目光转向中国的 AI 初创公司深度求索(DeepSeek)。深度求索于 2024 年 12 月发布了 DeepSeek-V3,随后在 2025 年 1 月 20 日推出了DeepSeek-R1、拥有 6710 亿参数的 DeepSeek-R1-Zero,以及参数范围在15亿至 700 亿之间的DeepSeek-R1-Distill模型。2025年1月 27日,他们又增加了基于视觉的Janus-Pro-7B模型。这些模型均公开可用,据报道,其性价比比同类模型高出90%至95%。据深度求索表示,其模型因其推理能力而脱颖而出,这得益于通过强化学习等创新训练方法实现的突破。

如今,您可以在AmazonBedrock和Amazon SageMaker AI中部署 DeepSeek-R1 模型。Amazon Bedrock最适合希望通过API快速集成预训练基础模型的团队。Amazon SageMaker AI则非常适合希望进行高级定制、训练和部署,并能够访问底层基础设施的组织。此外,您还可以使用Amazon Trainium和AmazonInferentia,通过Amazon Elastic Compute Cloud(Amazon EC2或Amazon SageMaker AI经济高效地部署DeepSeek-R1-Distill模型。

通过 亚马逊云科技,您可以使用DeepSeek-R1模型以最小的基础设施投资构建、试验并负责任地扩展生成式 AI 项目,得益于其强大的成本效益。您还可以基于 亚马逊云科技专为安全设计的服务,自信地推动生成式AI创新。我们强烈建议将DeepSeek-R1模型的部署与Amazon Bedrock Guardrails集成,为您的生成式AI应用程序增加一层保护,该功能可供Amazon Bedrock和Amazon SageMaker AI客户共同使用。

现在,您可以通过以下几种方式在 亚马逊云科技 上部署DeepSeek-R1模型:

  1. 通过Amazon Bedrock Marketplace获取DeepSeek-R1模型,

  2. 通过Amazon SageMaker JumpStart获取DeepSeek-R1模型,

  3. 通过Amazon Bedrock自定义模型导入功能获取DeepSeek-R1-Distill模型,

  4. 通过Amazon EC2 Trn1实例获取DeepSeek-R1-Distill模型。

让我为您详细介绍在 亚马逊云科技上开始使用DeepSeek-R1模型的各种路径。无论您是构建首个 AI 应用程序还是扩展现有解决方案,这些方法都可以根据团队的技能和需求提供灵活的起点。

  1. Amazon Bedrock Marketplace中的DeepSeek-R1模型

Amazon Bedrock Marketplace提供了超过 100 个流行、新兴和专业的基础模型(FMs),同时与当前行业领先的模型一起供选择。您可以轻松地在单一目录中发现模型,订阅模型,然后在托管的端点上部署模型。

要访问Amazon Bedrock Marketplace中的DeepSeek-R1模型,请进入Amazon Bedrock控制台,在"基础模型"部分选择"模型目录"。您可以通过搜索或按模型提供商筛选快速找到DeepSeek模型。

在查看模型详细信息页面(包括模型的功能和实施指南)后,您可以直接部署模型,只需提供端点名称、选择实例数量并选择实例类型即可。

您还可以配置高级选项,以自定义DeepSeek-R1模型的安全性和基础设施设置,包括VPC网络、服务角色权限和加密设置。对于生产部署,您应审查这些设置,以确保其符合您组织的安全性和合规性要求。

通过Amazon Bedrock Guardrails,您可以独立评估用户输入和模型输出。您可以通过生成式AI应用程序中过滤不良和有害内容,根据自定义的策略集控制用户与DeepSeek-R1之间的交互。Amazon Bedrock Marketplace中的DeepSeek-R1模型只能与Bedrock的ApplyGuardrail API结合使用,以评估用户输入和模型响应,适用于Amazon Bedrock之外的自定义和第三方基础模型(FMs)。了解更多信息,请阅读[使用 Amazon Bedrock Guardrails 实施模型无关的安全措施](https://Amazon.amazon.com/cn/blogs/machine-learning/implement-model-independent-safety-measures-with-amazon-bedrock-guardrails/)。

Amazon Bedrock Guardrails还可以与其他Bedrock工具集成,包括Amazon Bedrock Agents和 Amazon Bedrock Knowledge Bases,以构建更安全、更符合负责任AI政策的生成式AI应用程序。了解更多信息,请访问[亚马逊云科技负责任AI页面](https://Amazon.amazon.com/cn/machine-learning/responsible-ai/)。

2025年2月1日更新 --- 您可以使用Bedrock的Playground功能,了解模型对各种输入的响应方式,并优化提示词以获取最佳结果。

在使用DeepSeek-R1模型与Bedrock的Playground或InvokeModel API时,请使用DeepSeek的聊天模板以获得最佳效果。例如:

复制代码
<|begin_of_sentence|><|User|>content for inference<|Assistant|>.
  1. Amazon SageMaker JumpStart中的DeepSeek-R1模型

Amazon SageMaker JumpStart是一个机器学习(ML)中心,提供基础模型(FMs)、内置算法和预构建的ML 解决方案,只需点击几下即可部署。要在SageMaker JumpStart中部署DeepSeek-R1模型,您可以在SageMaker Unified Studio、SageMaker Studio或SageMaker AI控制台中发现该模型,或通过SageMaker Python SDK以编程方式查找。

在Amazon SageMaker AI控制台中,打开SageMaker Studio,选择JumpStart,然后在"所有公共模型"页面中搜索"DeepSeek-R1"。

选择模型后,点击"部署"即可使用默认设置创建端点。当端点状态变为"InService"(服务中)时,您可以通过向其端点发送请求来进行推理。

相关推荐
是店小二呀1 分钟前
AI前沿:资本狂潮下的技术暗战:巨头博弈、开源革命与生态重构
人工智能·重构·开源
snowfoootball33 分钟前
基于 Ollama DeepSeek、Dify RAG 和 Fay 框架的高考咨询 AI 交互系统项目方案
前端·人工智能·后端·python·深度学习·高考
云和数据.ChenGuang42 分钟前
机器学习之回归算法
人工智能·机器学习·回归
odoo中国1 小时前
深度学习 Deep Learning 第15章 表示学习
人工智能·深度学习·学习·表示学习
橙色小博1 小时前
长短期记忆神经网络(LSTM)基础学习与实例:预测序列的未来
人工智能·python·深度学习·神经网络·lstm
深蓝学院1 小时前
闭环SOTA!北航DiffAD:基于扩散模型实现端到端自动驾驶「多任务闭环统一」
人工智能·机器学习·自动驾驶
jimmyleeee1 小时前
人工智能基础知识笔记七:随机变量的几种分布
人工智能·笔记·概率论
仙人掌_lz1 小时前
机器学习ML极简指南
人工智能·python·算法·机器学习·面试·强化学习
weixin_435208162 小时前
论文浅尝 | Interactive-KBQA:基于大语言模型的多轮交互KBQA(ACL2024)
人工智能·语言模型·自然语言处理
碣石潇湘无限路2 小时前
【奇点时刻】GPT-4o新生图特性深度洞察报告
人工智能·经验分享·chatgpt·gpt4o·新生图特性