从零开发短视频电商 在AWS SageMaker已创建的模型列表中进行部署

1.导航到 SageMaker 控制台。

2.在 SageMaker 控制台的左侧导航栏中,选择 "模型" 选项。

3.在模型列表中,找到您要部署的模型。选择该模型。

4.点击 "创建端点" 选项或者点击 "创建端点配置" 选项都可以进行部署。

选择创建端点进去后还是会进行创建端点配置或者用已有的端点配置

5.在配置端点页面,您需要指定端点名称端点配置的名称端点类型

  • 端点名称很重要,后面访问的时候要用到的endpoint就是这个了。
  • 端点配置名称,这个配置生成后,后面可以直接选择现有端点快速部署端点了。
  • 端点类型选已预制哈,不会有severless的冷启动问题。

6.继续在配置端点页面,指定模型实例类型初始实例数初始权重

7.然后点击创建端点配置

8.创建端点

9.去端点处查看启动情况。

相关推荐
45288655上山打老虎3 小时前
C++完美转发
java·jvm·c++
Seven973 小时前
查找算法
java
骥龙4 小时前
3.10、构建网络防线:防火墙、WAF 与蜜罐实战
服务器·网络·数据库·网络安全
毕设源码-朱学姐4 小时前
【开题答辩全过程】以 公务员考试在线测试系统为例,包含答辩的问题和答案
java
serendipity_hky4 小时前
【SpringCloud | 第2篇】OpenFeign远程调用
java·后端·spring·spring cloud·openfeign
RwTo4 小时前
【源码】-Java线程池ThreadPool
java·开发语言
SadSunset4 小时前
(15)抽象工厂模式(了解)
java·笔记·后端·spring·抽象工厂模式
兮动人4 小时前
EMT4J定制规则版:Java 8→17迁移兼容性检测与规则优化实战
java·开发语言·emt4j
一点★4 小时前
Java中的常量池和字符串常量池
java·开发语言
九河云5 小时前
华为云 ECS 弹性伸缩技术:应对业务峰值的算力动态调度策略
大数据·服务器·人工智能·物联网·华为云