【Wandb】Linux环境下通过Docker部署Wandb教程

一、前期准备

我自己本身是root,如果不是root用户可能要在命令前加上sudo

1. 代理

确保你能访问到wandb的官网

2. 许可证

需要到wandb官网注册一个许可证

3. 需要你已经配置好了docker

bash 复制代码
# 确认一下
docker --version

二、安装流程

1. 介绍

Docker则是在容器化环境中使用Wandb。使用Docker可以确保Wandb的环境与项目的其他部分隔离开来,从而避免环境依赖冲突。这种方式适合需要跨不同平台和机器运行的用户,或者在大规模分布式系统上使用的场景。

2. 部署

拉取 Wandb Docker 镜像:

bash 复制代码
docker pull wandb/local:latest

3. 启动本地容器测试

bash 复制代码
sudo docker run -d --name wandb-local -p 8080:8080 -v /path/to/your/local/folder:/root/wandb wandb/local:latest
  • -d:在后台运行容器。
  • --name wandb-local:给容器命名为 wandb-local
  • -p 8080:8080:将容器的 8080 端口映射到本地的 8080 端口,便于访问 Wandb 本地服务。
  • -v /path/to/your/local/folder:/root/wandb:将本地文件夹挂载到容器中,这样你可以将你的实验数据存储在本地文件夹中。

4. 验证容器是否正常运行

这应该会显示你的 wandb-local 容器正在运行。

bash 复制代码
docker ps

5. 通过浏览器访问Wandb服务

我的虚拟机地址为192.168.10.100,配置的端口为8080

使用浏览器访问192.168.10.100:8080

三、Python测试

1. 确保你的linux安装了python3

直接安装python3或者使用anaconda都可以

建议用conda的话单独创建一个环境测试,别瞎搞再把其他环境搞崩了

2. 第一次安装wandb

bash 复制代码
pip install wandb

建议加上清华源镜像,体验飞一般的感觉

bash 复制代码
pip install wandb -i https://pypi.tuna.tsinghua.edu.cn/simple/

我的出现了这个报错,意思是少了个go编译环境,得安装一下

3. 安装go

理论上是可以这么装的,但是这下载速度有点过于慢了,所以我直接官网下载

bash 复制代码
yum install -y golang

这个是官网链接:https://go.dev/dl/

下载之后上传到linux服务器里,我是用的MobaXterm直接上传的,你们根据自己的程序定

Go的压缩包文件:go1.25.5.linux-amd64.tar.gz

将下载的压缩包解压到/usr/local目录

bash 复制代码
tar -C /usr/local -xvzf go1.25.5.linux-amd64.tar.gz

配置环境变量

bash 复制代码
vim /etc/profile

在文件末尾添加以下内容

bash 复制代码
# Go
export PATH=$PATH:/usr/local/go/bin

更新环境变量

bash 复制代码
source /etc/profile

验证是否安装成功

bash 复制代码
go version

4. 第二次安装wandb

bash 复制代码
pip install wandb -i https://pypi.tuna.tsinghua.edu.cn/simple/

我真服了,又说没有Rust,让我再装一下Rust

5. 安装Rust

网络好的可以试试这个方法,不过我是一直卡住的

bash 复制代码
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
source $HOME/.cargo/env
rustc --version

我直接把上网工具改成了"全局"就好使了

直接回车

牛!!!

配置环境变量

bash 复制代码
echo 'source "$HOME/.cargo/env"' >> ~/.bashrc
bash 复制代码
source ~/.bashrc
bash 复制代码
sudo yum groupinstall "Development Tools"
sudo yum install rust cargo

安装成功

bash 复制代码
rustc --version
cargo --version

6. 第三次安装wandb

bash 复制代码
pip install wandb -i https://pypi.tuna.tsinghua.edu.cn/simple/

再次报错,说是缺少依赖文件

7. 跳过收集GPU数据

实在没招了只能跳过收集GPU数据了, 不知道是不是因为我这个Linux是Windows的虚拟机,本身没有GPU的原因

bash 复制代码
export WANDB_BUILD_SKIP_GPU_STATS=true
bash 复制代码
pip install wandb -i https://pypi.tuna.tsinghua.edu.cn/simple/

安装成功

8. 测试wandb是否成功

python 复制代码
import wandb

# 设置 Wandb 为本地模式
wandb.init(project="local-test", entity="your_username", mode="offline")

# 记录数据
wandb.log({"accuracy": 0.9})

wandb.finish()

执行成功

相关推荐
小草cys6 小时前
在 openEuler 上安装 DDE 图形桌面环境(适用于华为鲲鹏服务器/PC)
运维·服务器
AAD5558889914 小时前
YOLO11-EfficientRepBiPAN载重汽车轮胎热成像检测与分类_3
人工智能·分类·数据挖掘
天才奇男子14 小时前
HAProxy高级功能全解析
linux·运维·服务器·微服务·云原生
小李独爱秋14 小时前
“bootmgr is compressed”错误:根源、笔记本与台式机差异化解决方案深度指南
运维·stm32·单片机·嵌入式硬件·文件系统·电脑故障
fanstuck14 小时前
从0到提交,如何用 ChatGPT 全流程参与建模比赛的
大数据·数学建模·语言模型·chatgpt·数据挖掘
Dying.Light15 小时前
Linux部署问题
linux·运维·服务器
S190115 小时前
Linux的常用指令
linux·运维·服务器
萤丰信息15 小时前
AI 筑基・生态共荣:智慧园区的价值重构与未来新途
大数据·运维·人工智能·科技·智慧城市·智慧园区
小义_15 小时前
【RH134知识点问答题】第7章 管理基本存储
linux·运维·服务器
运维小欣16 小时前
Agentic AI 与 Agentic Ops 驱动,智能运维迈向新高度
运维·人工智能