亚马逊云科技(AWS)近期宣布,DeepSeek-R1 模型现已在 AWS 平台上正式上线。这一强大且高性价比的模型代表了人工智能推理能力的突破,能够在复杂任务中提供卓越的准确性和深刻的理解。凭借其强大的推理能力,DeepSeek-R1 在数学领域和软件工程等方面表现出色。
AWS 提供多种方式供用户部署 DeepSeek-R1 模型:
-
Amazon Bedrock Marketplace:用户可以在此平台上直接部署 DeepSeek-R1 模型。
-
Amazon SageMaker JumpStart:通过 SageMaker JumpStart,用户可以轻松访问和部署 DeepSeek-R1 模型。
-
Amazon Bedrock 自定义模型导入功能:此功能允许用户导入并部署 DeepSeek-R1-Distill 模型。
-
Amazon EC2 Trn1 实例:用户可以利用 AWS 自研的 Trainium 芯片,通过 EC2 Trn1 实例部署 DeepSeek-R1-Distill 模型。
这些选项使用户能够根据自身需求和基础设施选择最适合的部署方式,确保以最低的基础设施投资构建、实验并负责任地扩展生成式人工智能创意。
值得注意的是,AWS 强烈建议将 DeepSeek-R1 模型的部署与 Amazon Bedrock 防护机制集成,为生成式人工智能应用程序增添一层保护。
此外,AWS 还提供了关于如何使用其自研芯片 Inferentia2 部署 DeepSeek-R1-Distill 模型的详细指南。Inferentia2 是 AWS 自主研发的云端机器学习推理芯片,为深度学习推理工作负载提供高性能和高效率的计算能力,帮助客户在云端高效地部署和运行机器学习模型。
总而言之,DeepSeek-R1 模型的上线为开发者和企业提供了强大的工具,能够以最小的基础设施投资构建和扩展生成式人工智能应用程序。AWS 提供的多种部署选项和强大的基础设施支持,使用户能够自信地推动生成式人工智能创新。