【GPU使用】如何在物理机和Docker中指定GPU进行推理和训练

我的机器上有4张H100卡,我现在只想用某一张卡跑程序,该如何设置。

代码里面设置

bash 复制代码
import os
# 记住要写在impot torch前
os.environ['CUDA_VISIBLE_DEVICES'] = "0, 1"

命令行设置

bash 复制代码
export CUDA_VISIBLE_DEVICES=0,2 # Linux 环境
python test.py # 运行程序

docker 设置

bash 复制代码
docker run --gpus device=2 --shm-size 1024g 

docker run --gpus all --shm-size 1024g 

docker run --gpus device=1,2 --shm-size 1024g  

拉取镜像

复制代码
docker pull vllm/vllm-openai

备注,国内用户,可以使用代理源来加速镜像下载:

docker pull docker.1ms.run/vllm/vllm-openai

无法 import 某个package

bash 复制代码
import sys
sys.path.append('/your/home/package/')

docker设置代理

相关推荐
yingdonglan9 分钟前
鸿蒙跨端Flutter学习——GridView高级功能
linux·运维·windows
遇见火星22 分钟前
在Linux中使用journalctl命令进行日志分析和管理详细教程
linux·运维·服务器·journalctl
xuefuhe29 分钟前
RHEL9 yum install etcd Error: Unable to find a match: etcd
linux·运维·centos
susu108301891134 分钟前
docker启动kafka
docker·容器·kafka
我送炭你添花1 小时前
树莓派部署 GenieACS 作为终端TR-069 ACS(自动配置服务器)的详细规划方案
运维·服务器·网络协议
华农第一蒟蒻1 小时前
一次服务器CPU飙升的排查与解决
java·运维·服务器·spring boot·arthas
NGINX开源社区1 小时前
借助 Okta 和 NGINX Ingress Controller 实现 K8s OpenID Connect 身份验证
运维·nginx·kubernetes
郝亚军1 小时前
如何在windows11和Ubuntu linux之间互传文件
linux·运维·ubuntu
j_xxx404_1 小时前
Linux:进程状态
linux·运维·服务器
济6171 小时前
linux 系统移植(第二十三期)---- 进一步完善BusyBox构建的根文件系统---- Ubuntu20.04
linux·运维·服务器