【GPU使用】如何在物理机和Docker中指定GPU进行推理和训练

我的机器上有4张H100卡,我现在只想用某一张卡跑程序,该如何设置。

代码里面设置

bash 复制代码
import os
# 记住要写在impot torch前
os.environ['CUDA_VISIBLE_DEVICES'] = "0, 1"

命令行设置

bash 复制代码
export CUDA_VISIBLE_DEVICES=0,2 # Linux 环境
python test.py # 运行程序

docker 设置

bash 复制代码
docker run --gpus device=2 --shm-size 1024g 

docker run --gpus all --shm-size 1024g 

docker run --gpus device=1,2 --shm-size 1024g  

拉取镜像

复制代码
docker pull vllm/vllm-openai

备注,国内用户,可以使用代理源来加速镜像下载:

docker pull docker.1ms.run/vllm/vllm-openai

无法 import 某个package

bash 复制代码
import sys
sys.path.append('/your/home/package/')

docker设置代理

相关推荐
❥ღ Komo·8 分钟前
K8s集群搭建全流程详解
云原生·容器·kubernetes
不过普通话一乙不改名24 分钟前
Linux 网络发包的极致之路:从普通模式到 AF_XDP ZeroCopy
linux·运维·网络
x***13391 小时前
如何在Linux中找到MySQL的安装目录
linux·运维·mysql
8***84821 小时前
macOs安装docker且在docker上部署nginx+php
nginx·macos·docker
p***92481 小时前
服务器部署,用 nginx 部署后页面刷新 404 问题,宝塔面板修改(修改 nginx.conf 配置文件)
运维·服务器·nginx
HarrySunCn1 小时前
Rocky服务器部署前端静态项目的注意点
运维·服务器
w***37511 小时前
Nginx 的 proxy_pass 使用简介
运维·nginx
A***F1572 小时前
从零到上线:Node.js 项目的完整部署流程(包含 Docker 和 CICD)
docker·容器·node.js
uxiang_blog2 小时前
Linux学习之旅8
linux·运维·学习
云计算-Security3 小时前
基于 Kickstart 的 Linux OS CICD 部署(webhook)
运维·自动化·jenkins