stable diffusion艰难炼丹之路

文章目录

概要

主要是通过autoDL服务器部署stable diffusion,通过dreambooth训练大模型。

问题:

  1. autoDL系统盘爆满
  2. autoDL python3.8切换python3.10
  3. dreambooth训练大模型完成后报错

autoDL系统盘爆满

  1. 服务器官网给了解决办法,系统盘不足的解决地址
  2. 但是你要是想通过dreambooth训练模型,就不能按照这个文档操作。
  3. 在 .cacah/文件中有个缓存huggingface文件,删除后dreambooth找不到huggingface资源就报错。
  4. 所以大家在清除.cacah/路径下的文件时,一定注意不要删除这个huggingface缓存资源。

autoDL python3.8切换python3.10

更换python环境,主要是在sd服务中安装Kohya_ss,这个图片预处理打完tag后,直接进行训练lora。

执行如下程序,在my-env虚拟环境中操作,就可以运行Kohya_ss。

powershell 复制代码
# 构建一个虚拟环境名为:my-env,Python版本为3.7
conda create -n my-env python=3.10.12    

# 更新bashrc中的环境变量
conda init bash && source /root/.bashrc
# 切换到创建的虚拟环境:my-env
conda activate my-env

# 验证
python

其实autodl中有lora训练的服务器,这个训练页面纯txt文件,对新手不友好,而且这个里面没有打标签的工具,还需要在其他sd服务通过图片预处理打好标签后放到这个服务其中,进行训练。新建Kohya_ss如下图:

dreambooth训练大模型完成后报错

报错: Exception training model: ''AttnProcessor2_0' object has no attribute 'state_dict''. 且没有生成大模型

将这个选项勾上,这个选项只要是在运行中报错模型,这个在结束时报错,也不会影响模型保存。

这个路径下就会出现训练的大模型 autodl-tmp/stable-diffusion-webui/models/Stable-diffusion

相关推荐
吐个泡泡v21 小时前
扩散模型详解:从DDPM到Stable Diffusion再到DiT的技术演进
stable diffusion·transformer·扩散模型·ddpm·dit
Blossom.1181 天前
基于MLOps+LLM的模型全生命周期自动化治理系统:从数据漂移到智能回滚的落地实践
运维·人工智能·学习·决策树·stable diffusion·自动化·音视频
不会kao代码的小王4 天前
openEuler上Docker部署Kafka消息队列实战
前端·云原生·stable diffusion·eureka
Blossom.1186 天前
基于多智能体强化学习的云资源调度系统:如何用MARL把ECS成本打下来60%
人工智能·python·学习·决策树·机器学习·stable diffusion·音视频
Yeliang Wu7 天前
Stable Diffusion WebUI 从安装到实战:原理、部署与问题全解
stable diffusion
Yeliang Wu7 天前
ComfyUI 全流程指南:安装、配置、插件与模型选型
stable diffusion·文生图·图生图·comfyui
LCG米8 天前
[OpenVINO实战] 在边缘设备上运行Stable Diffusion,实现离线文生图
人工智能·stable diffusion·openvino
水上冰石8 天前
rtx5060部署stable-diffusion1.10.1版本注意事项
stable diffusion
水上冰石8 天前
stable-diffusion-webui的v1.10.1版本汉化
stable diffusion
梯度下降不了班8 天前
【mmodel/xDit】Cross-Attention 深度解析:文生图/文生视频的核心桥梁
人工智能·深度学习·ai作画·stable diffusion·音视频·transformer