triton backend 模式docker 部署 pytorch gpu模型 镜像选择

1.选取镜像类型

参考 官方tag 对应的镜像地址

https://catalog.ngc.nvidia.com/orgs/nvidia/containers/tritonserver?version=25.09-trtllm-python-py3

nvcr.io/nvidia/tritonserver 镜像主要分为三类

pyt-python-py3

trtllm-python-py3

py3

看下图

可以看出 py3 < pyt < llm Py3

因为本次安装的是基于 pytorch pth模型,同时需要pytorch 进行数据处理成张量。所以选择 pyt-python-py3

2.确定镜像版本

查看 机器的cuda 和驱动版本

nvidia-smi

NVIDIA-SMI 545.23.08 Driver Version: 545.23.08 CUDA Version: 12.3

确定镜像的版本,否则镜像是不能支持对应的版本的。 nvidia的官网 不同版本对应的环境

https://docs.nvidia.com/deeplearning/triton-inference-server/release-notes/rel-23-11.html#rel-23-11

3.安装pytorch

虽然镜像说是提供了pytorch 但是依旧需要下载torch 包,可能是我选择的版本问题吧...

bash 复制代码
pip install torch==2.3.1 torchvision==0.18.1 --extra-index-url https://download.pytorch.org/whl/cu121   -i https://pypi.tuna.tsinghua.edu.cn/simple

安装工具包

bash 复制代码
pip install pandas numpy scikit-learn  -i https://pypi.tuna.tsinghua.edu.cn/simple

4.启动docker 和 triton

我是分开执行,各位可以直接一把启动哈

1.根据命令启动docker

bash 复制代码
docker run -it  \
   --gpus device=6 \
  -p 18000:8000 -p 18001:8001  -p 18002:8002\   
  -v /opt/triton_inference_serve/model_repository:/models \
  --name triton-pytorch-dsn \
  nvcr.io/nvidia/tritonserver:23.12-pyt-python-py3 \
  bash

--gpus device=6

选择gpu号

-p 18000:8000 -p 18001:8001 -p 18002:8002\

暴露接口

-v /opt/triton_inference_serve/model_repository:/models

挂载模型目录

2.启动triton

我使用了nohup,避免每次启动

bash 复制代码
nohup tritonserver \
  --model-repository=/models \
  --backend-directory=/opt/tritonserver/backends \
  --backend-config=python,execution_mode=enabled \
  --log-verbose=2 \
  --log-file=/models/dsn/logs/triton.log \
  > /models/dsn/logs/nohup.out 2>&1 &

--model-repository=/models

指定模型执行地址

--backend-directory=/opt/tritonserver/backends

指定后端启动的python 库

--log-verbose=2 >1 表示开启日志

--log-file=/models/dsn/logs/triton.log \

/models/dsn/logs/nohup.out 2>&1 &

nohup启动日志

相关推荐
hboot7 小时前
AI工程师第四课 - 深度学习入门
pytorch·python·神经网络
weiwei228443 天前
神经网络模型导出及开放标准格式ONNX
pytorch·onnx
Patrick_Wilson4 天前
从「改个端口」到 502:Next.js on k8s 的容器端口、Service 映射与 env 覆盖
docker·kubernetes·next.js
Suroy5 天前
DockerView-Go:用 Go 写一个终端 Docker 监控工具,顺便做了个 Web 仪表盘
docker
云恒要逆袭5 天前
运行你的第一个Docker容器
后端·docker·容器
宋均浩6 天前
# Docker 镜像瘦身实战:从 1.2G 到 80MB 的五个优化步骤
ci/cd·docker
程序员老赵7 天前
10 分钟部署 OpenCode:Docker 一键安装,浏览器打开就能用 AI 写代码(附完整命令与排错)
docker·容器·ai编程
WangMingHua1117 天前
LM Studio Docker 部署——本地大模型一键启动
docker
曲幽8 天前
别再用网页翻译看源码了!你的私人翻译神器LibreTranslate,部署避坑指南来了
python·docker·web·pot·translate·libretranslate·arogstranslate
武子康10 天前
调查研究-183 Apple container:Mac 上用轻量 VM 跑 Linux 容器,Swift 会改写本地容器体验吗?
docker·容器·apple