CompVis Stable Diffusion 正确安装与运行指南


Stable Diffusion(CompVis版)正确安装与运行步骤

目标:使用 CompVis 官方仓库脚本 scripts/txt2img.py 在 CUDA 11.8 + PyTorch 2.3.1 环境下直接生成图片。

0) 前置环境

  • 已安装 Conda(或 Mamba)
  • 驱动支持 CUDA 11.8(nvidia-smi 正常)

1) 克隆仓库

bash 复制代码
git clone https://github.com/CompVis/stable-diffusion.git
cd stable-diffusion

2) 创建并激活环境(自定义路径示例)

你习惯的路径:/home/featurize/work/1/AMAC/envs/amac

bash 复制代码
# 创建空环境(Python 3.8/3.9/3.10 均可,和你现有 3.8 一致就行)
conda create -y -p /home/featurize/work/1/AMAC/envs/amac python=3.8
conda activate /home/featurize/work/1/AMAC/envs/amac

3) 安装 PyTorch(CUDA 11.8)

bash 复制代码
pip install torch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 \
  --index-url https://download.pytorch.org/whl/cu118

4) 安装项目所需的核心依赖

bash 复制代码
# 关键组件
pip install omegaconf einops
pip install transformers==4.28.0
pip install diffusers==0.30

# watermark:用 invisible-watermark,避免 imwatermark 系列冲突
pip uninstall -y imWatermark imwatermark || true
pip install invisible-watermark

# 视觉/图像处理(可选但常用)
pip install opencv-python==4.7.0.72
pip install kornia

为避免历史残留导致冲突,如之前装过 imWatermark/imwatermark,建议清理旧目录(可选):

bash 复制代码
rm -rf /home/featurize/work/1/AMAC/envs/amac/lib/python3.8/site-packages/imWatermark* \
       /home/featurize/work/1/AMAC/envs/amac/lib/python3.8/site-packages/imwatermark* || true

5) 安装/注册 Jupyter 内核(可选)

bash 复制代码
pip install ipykernel
python -m ipykernel install --user --name amac --display-name "amac-jupyter"

6) 可编辑方式安装本地包(让仓库内 ldm 等模块能被 import)

CompVis 仓库本身不强依赖 taming-transformers,但很多扩展/复现实验会用到。按你的做法,一并装上更省心。

bash 复制代码
# stable-diffusion 本体(可编辑安装)
pip install -e .

# taming-transformers(可选;部分脚本/模型会用到)
cd /home/featurize/work/1/AMAC
git clone https://github.com/CompVis/taming-transformers.git
cd taming-transformers
pip install -e .

# 回到 stable-diffusion 目录
cd -  # 或者 cd /path/to/stable-diffusion

7)(可选)安装 OpenAI CLIP(有些脚本/功能会用到)

bash 复制代码
pip install git+https://github.com/openai/CLIP.git

8) 准备权重

将 SD v1.x 的 model.ckpt 放到仓库要求路径(或软链接):

bash 复制代码
mkdir -p models/ldm/stable-diffusion-v1
ln -s /path/to/your/sd-v1-4.ckpt models/ldm/stable-diffusion-v1/model.ckpt

9) 运行文本生图(txt2img)

bash 复制代码
# 经典示例
python scripts/txt2img.py --prompt "a photograph of an astronaut riding a horse" --plms

# 如需指定显卡/分辨率等,请加参数:
#   --n_samples 1 --n_iter 1 --H 512 --W 512 --scale 7.5 --ddim_steps 50
# 多 GPU 环境下通常无需手动给 --gpus;若你使用的是旧版 Lightning 脚本才会用到该参数。

##(可选)10) 你常用的小工具/数据

bash 复制代码
# 仅当需要时再装
pip install academictorrents

备注与坑点避雷

  1. 不要混装多版 pytorch-lightning
    你的历史命令里有 1.4.2 / 1.7.7 / 2.4.0 反复切换。本流程不需要显式安装 PL;如确有旧脚本依赖,再按脚本要求固定一个版本装,避免冲突。
  2. watermark 包务必用 invisible-watermark
    imwatermark/imWatermark 容易和依赖冲突或导致导入失败,已在步骤里清理并更换为 invisible-watermark
  3. Diffusers 与 CompVis 两套用法不要混淆
    本文是 CompVis 仓库脚本 的跑法(需要 .ckpt);若想用 diffusers 管线(从 Hub 拉权重),那是另一套接口,别把两者参数/目录搞混。

到这就可以稳定跑通了。

相关推荐
迈火3 天前
Facerestore CF (Code Former):ComfyUI人脸修复的卓越解决方案
人工智能·gpt·计算机视觉·stable diffusion·aigc·语音识别·midjourney
重启编程之路3 天前
Stable Diffusion 参数记录
stable diffusion
孤狼warrior6 天前
图像生成 Stable Diffusion模型架构介绍及使用代码 附数据集批量获取
人工智能·python·深度学习·stable diffusion·cnn·transformer·stablediffusion
love530love9 天前
【避坑指南】提示词“闹鬼”?Stable Diffusion 自动注入神秘词汇 xiao yi xian 排查全记录
人工智能·windows·stable diffusion·model keyword
世界尽头与你9 天前
Stable Diffusion web UI 未授权访问漏洞
安全·网络安全·stable diffusion·渗透测试
love530love9 天前
【故障解析】Stable Diffusion WebUI 更换主题后启动报 JSONDecodeError?可能是“主题加载”惹的祸
人工智能·windows·stable diffusion·大模型·json·stablediffusion·gradio 主题
ai_xiaogui13 天前
Stable Diffusion Web UI 绘世版 v4.6.1 整合包:一键极速部署,深度解决 AI 绘画环境配置与 CUDA 依赖难题
人工智能·stable diffusion·环境零配置·高性能内核优化·全功能插件集成·极速部署体验
微学AI14 天前
金仓数据库的新格局:以多模融合开创文档数据库
人工智能·stable diffusion
我的golang之路果然有问题14 天前
开源绘画大模型简单了解
人工智能·ai作画·stable diffusion·人工智能作画
我的golang之路果然有问题14 天前
comfyUI中的动作提取分享
人工智能·stable diffusion·ai绘画·人工智能作画·comfy