stable diffusion艰难炼丹之路

Ethan03962023-10-11 18:16

文章目录

- 概要
- autoDL系统盘爆满
- [autoDL python3.8切换python3.10](#autoDL python3.8切换python3.10)
- dreambooth训练大模型完成后报错

概要

主要是通过autoDL服务器部署stable diffusion，通过dreambooth训练大模型。

问题：

autoDL系统盘爆满
autoDL python3.8切换python3.10
dreambooth训练大模型完成后报错

autoDL系统盘爆满

服务器官网给了解决办法，系统盘不足的解决地址。
但是你要是想通过dreambooth训练模型，就不能按照这个文档操作。
在 .cacah/文件中有个缓存huggingface文件，删除后dreambooth找不到huggingface资源就报错。
所以大家在清除.cacah/路径下的文件时，一定注意不要删除这个huggingface缓存资源。

autoDL python3.8切换python3.10

更换python环境，主要是在sd服务中安装Kohya_ss，这个图片预处理打完tag后，直接进行训练lora。

执行如下程序，在my-env虚拟环境中操作，就可以运行Kohya_ss。

powershell 复制代码

# 构建一个虚拟环境名为：my-env，Python版本为3.7
conda create -n my-env python=3.10.12    

# 更新bashrc中的环境变量
conda init bash && source /root/.bashrc
# 切换到创建的虚拟环境：my-env
conda activate my-env

# 验证
python

其实autodl中有lora训练的服务器，这个训练页面纯txt文件，对新手不友好，而且这个里面没有打标签的工具，还需要在其他sd服务通过图片预处理打好标签后放到这个服务其中，进行训练。新建Kohya_ss如下图：

dreambooth训练大模型完成后报错

报错： Exception training model: ''AttnProcessor2_0' object has no attribute 'state_dict''. 且没有生成大模型

将这个选项勾上，这个选项只要是在运行中报错模型，这个在结束时报错，也不会影响模型保存。

这个路径下就会出现训练的大模型 autodl-tmp/stable-diffusion-webui/models/Stable-diffusion