【GPU使用】如何在物理机和Docker中指定GPU进行推理和训练

我的机器上有4张H100卡,我现在只想用某一张卡跑程序,该如何设置。

代码里面设置

bash 复制代码
import os
# 记住要写在impot torch前
os.environ['CUDA_VISIBLE_DEVICES'] = "0, 1"

命令行设置

bash 复制代码
export CUDA_VISIBLE_DEVICES=0,2 # Linux 环境
python test.py # 运行程序

docker 设置

bash 复制代码
docker run --gpus device=2 --shm-size 1024g 

docker run --gpus all --shm-size 1024g 

docker run --gpus device=1,2 --shm-size 1024g  

拉取镜像

复制代码
docker pull vllm/vllm-openai

备注,国内用户,可以使用代理源来加速镜像下载:

docker pull docker.1ms.run/vllm/vllm-openai

无法 import 某个package

bash 复制代码
import sys
sys.path.append('/your/home/package/')

docker设置代理

相关推荐
wyjcxyyy26 分钟前
打靶日记-RCE-labs(续)
linux·运维·服务器
六点半8881 小时前
【Linux】Linux编译器-gcc/g++使用
linux·运维·服务器
东风微鸣1 小时前
GitOps:云原生时代的革命性基础设施管理范式
docker·云原生·kubernetes·可观察性
我才是一卓1 小时前
排查解决 nvidia-suspend 导致的 linux 系统无响应/死机问题
linux·运维·服务器
David爱编程2 小时前
Kubernetes NetworkPolicy 实践与策略误区
云原生·容器·kubernetes
Tipriest_3 小时前
linux eval命令的使用方法介绍
linux·运维·bash
laoma-cloud3 小时前
网络基础实操篇-05-路由基础-最佳实践
运维·网络·智能路由器
孟婆来包棒棒糖~3 小时前
Docker快速入门
运维·spring boot·docker·容器·tomcat
IT成长日记3 小时前
【自动化运维神器Ansible】Ansible常用模块之setup模块详解
运维·自动化·ansible·setup·常用模块
IT成长日记3 小时前
【自动化运维神器Ansible】Ansible常用模块之lineinfile模块详解
运维·自动化·ansible·常用模块·lineinfile