从零开发短视频电商 在AWS SageMaker已创建的模型列表中进行部署

1.导航到 SageMaker 控制台。

2.在 SageMaker 控制台的左侧导航栏中,选择 "模型" 选项。

3.在模型列表中,找到您要部署的模型。选择该模型。

4.点击 "创建端点" 选项或者点击 "创建端点配置" 选项都可以进行部署。

选择创建端点进去后还是会进行创建端点配置或者用已有的端点配置

5.在配置端点页面,您需要指定端点名称端点配置的名称端点类型

  • 端点名称很重要,后面访问的时候要用到的endpoint就是这个了。
  • 端点配置名称,这个配置生成后,后面可以直接选择现有端点快速部署端点了。
  • 端点类型选已预制哈,不会有severless的冷启动问题。

6.继续在配置端点页面,指定模型实例类型初始实例数初始权重

7.然后点击创建端点配置

8.创建端点

9.去端点处查看启动情况。

相关推荐
小CC吃豆子2 分钟前
Java数据结构与算法
java·开发语言
晨旭缘3 分钟前
后端日常启动及常用命令(Java)
java·开发语言
CodeAmaz3 分钟前
ArrayList 底层原理
java·arraylist
山峰哥4 分钟前
3000字深度解析:SQL调优如何让数据库查询效率提升10倍
java·服务器·数据库·sql·性能优化·编辑器
tkevinjd5 分钟前
JUC2(多线程中常用的成员方法)
java
天天摸鱼的java工程师11 分钟前
工作中 Java 程序员如何集成 AI?Spring AI、LangChain4j、JBoltAI 实战对比
java·后端
星辰_mya11 分钟前
RockerMQ之commitlog与consumequeue
java·开发语言
__万波__12 分钟前
二十三种设计模式(二十二)--策略模式
java·设计模式·策略模式
不想上班的小吕12 分钟前
采购申请创建(BAPI_PR_CREATE/BAPI_REQUISITION_CREATE)
java·服务器·数据库
专注VB编程开发20年16 分钟前
压栈顺序是反向(从右往左)的,但正因为是反向压栈,所以第一个参数反而离栈顶(ESP)最近。
java·开发语言·算法