从零开发短视频电商 在AWS SageMaker已创建的模型列表中进行部署

1.导航到 SageMaker 控制台。

2.在 SageMaker 控制台的左侧导航栏中,选择 "模型" 选项。

3.在模型列表中,找到您要部署的模型。选择该模型。

4.点击 "创建端点" 选项或者点击 "创建端点配置" 选项都可以进行部署。

选择创建端点进去后还是会进行创建端点配置或者用已有的端点配置

5.在配置端点页面,您需要指定端点名称端点配置的名称端点类型

  • 端点名称很重要,后面访问的时候要用到的endpoint就是这个了。
  • 端点配置名称,这个配置生成后,后面可以直接选择现有端点快速部署端点了。
  • 端点类型选已预制哈,不会有severless的冷启动问题。

6.继续在配置端点页面,指定模型实例类型初始实例数初始权重

7.然后点击创建端点配置

8.创建端点

9.去端点处查看启动情况。

相关推荐
吃饱了得干活11 小时前
Spring Cloud Gateway 微服务网关:路由、断言、过滤器
java·spring cloud
lwx5728013 小时前
探秘InnoDB:搞懂它的内存、线程、磁盘与日志刷盘策略
java·后端
Flynt14 小时前
从Spring Boot 4.0升到4.1,我在Maven和gRPC上栽了跟头
java·spring boot·后端
plainGeekDev15 小时前
Activity 间传值 → Navigation 参数
android·java·kotlin
plainGeekDev15 小时前
onActivityResult → ActivityResult API
android·java·kotlin
Sunia15 小时前
《AgentX 专栏》10-生产部署:3台2C4G云服务器把企业级Agent真正跑起来的完整方案
java·架构
ZhengEnCi16 小时前
J7A-高级Java工程师面试三道灵魂拷问-深度广度与工程素养的终极检验
java·后端
狼爷1 天前
吃透 Java Function 接口,搞定 99% 的 Stream 场景
java·函数式编程
祎雪双十Gy2 天前
从 DataX 的配置加载说起:我用 FastJson2 做了一个轻量级动态配置管理库
java·后端
小锋java12342 天前
分享一套锋哥原创的SpringBoot4+Vue3宠物领养网站系统
java