从零开发短视频电商 在AWS SageMaker已创建的模型列表中进行部署

1.导航到 SageMaker 控制台。

2.在 SageMaker 控制台的左侧导航栏中,选择 "模型" 选项。

3.在模型列表中,找到您要部署的模型。选择该模型。

4.点击 "创建端点" 选项或者点击 "创建端点配置" 选项都可以进行部署。

选择创建端点进去后还是会进行创建端点配置或者用已有的端点配置

5.在配置端点页面,您需要指定端点名称端点配置的名称端点类型

  • 端点名称很重要,后面访问的时候要用到的endpoint就是这个了。
  • 端点配置名称,这个配置生成后,后面可以直接选择现有端点快速部署端点了。
  • 端点类型选已预制哈,不会有severless的冷启动问题。

6.继续在配置端点页面,指定模型实例类型初始实例数初始权重

7.然后点击创建端点配置

8.创建端点

9.去端点处查看启动情况。

相关推荐
x***r1514 分钟前
linux安装 jdk-8u291-linux-x64.tar.gz 详细步骤(解压配置环境变量)
java
极光代码工作室39 分钟前
基于SpringBoot的校园论坛系统
java·springboot·web开发·后端开发
XS0301061 小时前
Spring Bean 作用域 & 生命周期
java·后端·spring
NagatoYukee1 小时前
Spring Security基础部分学习
java·学习·spring
彦为君1 小时前
JavaSE-07-异常机制
java·开发语言·后端·python·spring
古月方枘Fry1 小时前
MGRE实验
运维·服务器
博客-小覃2 小时前
Zabbix之华为交换机的日志记录信息操作详细教程
服务器·网络·华为·zabbix
_Aaron___2 小时前
Spring AI 接入 MCP:工具调用不是“能调就行”,关键是边界治理
java·人工智能·spring
stolentime2 小时前
FreeDomain 本地开发环境快速搭建指南
运维·服务器·网络
向量引擎2 小时前
从零起步,如何打造专属向量引擎 API 中转工作流?
java·服务器·前端