stable-zero123模型构建指南

一、介绍

stabilityai出品,能够对有简单背景的物体进行三维视角图片的生成,简单来说也就是通过调整变换观察的视角生成对应视角的图片。

本项目通过comfyui实现。

二、容器构建说明

1. 部署ComfyUI

(1)使用命令克隆ComfyUI

复制代码
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI

(2)安装 conda(如已安装则跳过)

下面需要使用 Anaconda 或 Mimiconda 创建虚拟环境,可以输入 conda --version 进行检查。下面是 Mimiconda 的安装过程:

按 Enter 键查看许可证条款,阅读完毕后输入 yes 接受条款,安装完成后,脚本会询问是否初始化 conda 环境,输入 yes 并按 Enter 键。

  • 运行 source ~/.bashrc 命令激活 conda 环境
  • 再次输入 conda --version 命令来验证是否安装成功,如果出现类似 conda 4.10.3 这样的输出就成功了。

(3)创建虚拟环境

输入下面的命令:

复制代码
conda create -n comfyui python=3.10
conda activate comfyui

(4)安装pytorch

复制代码
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu121

(5)安装项目依赖

复制代码
pip install -r requirements.txt

此时所需环境就已经搭建完成,通过下面命令进行启动:

复制代码
python main.py

访问网址得到类似下图界面即表示成功启动:

2. 下载zero123模型

(1)下载模型

访问 Hugging Face 搜索"stabilityai/stable-zero123"下载模型。首次访问该页面时,可能需要同意用户协议才能看到模型下载页。

模型:

将模型下载到 ComfyUI/models/checkpoint

(2)下载工作流

进入"3D 示例 |ComfyUI_examples (comfyanonymous.github.io)"需下载图中包含工作流的图片,放置到/comfyui_workflow文件中。

重新启动模型将工作流导入即可:

3. 拓展插件安装(可选)

(1)下载manager管理器

manager 是一个用来加强ComfyUI可用性的扩展,提供了对ComfyUI各种自定义节点的安装、删除、禁用、启用等管理功能。同时还提供了中心功能和便利功能,用来访问 ComfyUI 中各种信息。

复制代码
cd /ComfyUI/custom_nodes
git clone https://github.com/ltdrdata/ComfyUI-Manager.git

成功安装之后重启界面会出现一个"Manager"如图:

(2)界面汉化插件
复制代码
git clone https://github.com/AIGODLIKE/AIGODLIKE-ComfyUI-Translation.git

下载文件之后需要重新启动,重启模型之后:

设置一次之后可点击图中框选出的选项进行语言的切换:

(3)中文提示词插件安装
复制代码
cd /ComfyUI/custom_nodes
git clone https://github.com/thisjam/comfyui-sixgod_prompt.git

然后重启ComfyUI后看到下图的小标志就表示可以了:

使用方法:双击页面,在搜索框中搜索"six"即可出现,点击sixGodPrompts,此时出现的就是提示词的中文输入框可以替代自带的clip输入框,可点击左下角的小标或按"AIT"+"q"打开和隐藏。

使用方法如下:

相关推荐
卡索(CASO)汽车调查12 小时前
卡索(CASO)汽车调查:数据智能时代,汽车产业竞争格局与战略升维路径探析
大数据·人工智能·汽车·神秘顾客·汽车密采·神秘人·汽车研究
笨鸟笃行12 小时前
人工智能备考——2.1.1-2.1.5总结
人工智能·学习
晨非辰12 小时前
【数据结构】排序详解:从快速排序分区逻辑,到携手冒泡排序的算法效率深度评测
运维·数据结构·c++·人工智能·后端·深度学习·排序算法
能来帮帮蒟蒻吗12 小时前
深度学习(4)—— Pytorch快速上手!从零搭建神经网络
人工智能·pytorch·深度学习
Blossom.11812 小时前
大模型知识蒸馏实战:从Qwen-72B到Qwen-7B的压缩艺术
大数据·人工智能·python·深度学习·算法·机器学习·pygame
pingao14137812 小时前
零启动风速+多参数集成:金属超声波传感器的技术突破
人工智能·科技
wshzd12 小时前
LLM之Agent(二十八)|AI音视频转笔记方法揭秘
人工智能·笔记
IT_陈寒13 小时前
Python 3.12新特性实战:5个让你的代码效率翻倍的隐藏技巧!
前端·人工智能·后端
草莓熊Lotso13 小时前
C++ 二叉搜索树(BST)完全指南:从概念原理、核心操作到底层实现
java·运维·开发语言·c++·人工智能·经验分享·c++进阶
Dfreedom.13 小时前
大模型微调技术全景解析:从基础理论到工程实践
人工智能·大模型微调