LALIC环境安装过程

LALIC 按照官方环境installation步骤会报错,以下是建议的修正的安装流程

powershell 复制代码
conda create -n LALIC_env python=3.10
conda activate LALIC_env
pip install compressai==1.2.6
pip install ninja
pip install torchvision==0.19.0
pip install torch==2.4.0
pip install tensorboard

因为这个代码涉及到GPU与CUDA架构的问题,官方模型是在 single NVIDIA GeForce RTX 4090 GPU上训练出来的,我目前只在2080Ti上能够成功运行在A100上按照如下步骤解决完报错后重建图像是错误的,在A40或者H800上甚至没法跑,报错

powershell 复制代码
subprocess.CalledProcessError: Command '['ninja', '-v']' returned non-zero e

以下内容可以忽略


如果想试着在服务器 Slurm A100 环境下运行项目,顺利安装完如上环境后,LALIC 项目运行时有如下报错,如果同样遇到可以参考,但是不太建议,因为还是运行不了。

报错 1

报错内容:

powershell 复制代码
OSError: CUDA_HOME environment variable is not set. Please set it to your CUDA install root.

解决方案:

powershell 复制代码
conda install -c nvidia cuda-toolkit=12.4

报错 2

报错内容:

powershell 复制代码
ValueError: Unknown CUDA arch (10.0) or GPU not supported E0216 19:27:58.677000 139882420627264

解决方案:

(1)首先命令行运行 python,输入如下命令:

python 复制代码
import torch
print(torch.cuda.get_arch_list())

返回值如下:

powershell 复制代码
['sm_50', 'sm_60', 'sm_70', 'sm_75', 'sm_80', 'sm_86', 'sm_90']

,说明没有什么问题。

(2)只需在 sjob_LALIC.sh (也就是你的 Slurm 批处理命令文件中)中加入如下命令:

powershell 复制代码
export TORCH_CUDA_ARCH_LIST=""
相关推荐
nancy_princess13 小时前
clip实验
人工智能·深度学习
南境十里·墨染春水13 小时前
C++传记(面向对象)虚析构函数 纯虚函数 抽象类 final、override关键字
开发语言·c++·笔记·算法
无巧不成书021814 小时前
30分钟入门Java:从历史到Hello World的小白指南
java·开发语言
2301_7971727514 小时前
基于C++的游戏引擎开发
开发语言·c++·算法
AI医影跨模态组学14 小时前
Radiother Oncol 空军军医大学西京医院等团队:基于纵向CT的亚区域放射组学列线图预测食管鳞状细胞癌根治性放化疗后局部无复发生存期
人工智能·深度学习·医学影像·影像组学
A尘埃14 小时前
神经网络的激活函数+损失函数
人工智能·深度学习·神经网络·激活函数
没有不重的名么14 小时前
Pytorch深度学习快速入门教程
人工智能·pytorch·深度学习
有为少年15 小时前
告别“唯语料论”:用合成抽象数据为大模型开智
人工智能·深度学习·神经网络·算法·机器学习·大模型·预训练
AI医影跨模态组学15 小时前
J Transl Med(IF=7.5)苏州大学附属第一医院秦颂兵教授等团队:基于机器学习影像组学的食管鳞癌预后评估列线图
人工智能·深度学习·机器学习·ct·医学·医学影像
比昨天多敲两行15 小时前
C++ 二叉搜索树
开发语言·c++·算法