【可图(Kolors)部署与使用】大规模文本到图像生成模型部署与使用教程

Blog's 主页: 白乐天_ξ( ✿>◡❛)

🌈 个人Motto:他强任他强,清风拂山冈!

💫 欢迎来到我的学习笔记!

1.Kolors 简介

1.1.什么是Kolors?

  1. 开发团队
    Kolors 是由快手 Kolors 团队开发的文本到图像生成模型。
  2. 技术基础
    基于潜在扩散技术,通过对数十亿个文本图像对进行训练。
  3. 优势表现
    1. 视觉质量方面:生成的图像具有高清晰度、丰富的色彩和细腻的细节。
    2. 复杂语义准确性:能够准确理解和呈现文本中复杂的语义信息,使得生成的图像与文本描述高度契合。
    3. 中英文字符的文本渲染:在处理中英文文本时表现出色,能够将包含中英文字符的文本描述转化为高质量的图像。
  4. 语言支持
    支持中英文输入,在理解和生成中文内容方面展现出强大的性能,为中文用户提供了便利。

1.2.前提条件

  • Python 3.8 或更新版本
  • PyTorch 1.13.1 或更新版本
  • Transformers 4.26.1 或更新版本
  • 推荐:CUDA 11.7 或更新版本

1.3.DAMODEL 平台创建适配机器

下面我们将使用<font style="color:rgb(60, 60, 67);">8 卡 4090容器 </font>,按照 Kolors 要求选择对应版本。

创建实例

  1. 进入丹摩DAMODEL|让AI开发更简单!算力租赁上丹摩!店家开始创建实例:
  1. 进入创建页面后,首先在实例配置中选择付费类型。一般短期需求可以选择按量付费或者包日,长期需求可以选择包月套餐;

  2. 其次选择GPU数量和需求的GPU型号,首次创建实例推荐选择:

    1. 按量付费--GPU数量1--NVIDIA-GeForc-RTX-4090,该配置为60GB内存,24GB的显存(本次测试的LLaMA3.1 8B 版本至少需要GPU显存16G)
  3. 接下来配置数据硬盘的大小。每个实例默认附带了50GB的数据硬盘,首次创建可以就选择默认大小50GB。

注意:****如果您通过官方预制方式下载模型,建议扩容至60GB。

  1. 继续选择安装的镜像,选择PyTorch 2.4.0。
  1. 为保证安全登录,创建密钥对,输入自定义的名称,然后选择自动创建并将创建好的私钥保存的自己电脑中并将后缀改为.pem,以便后续本地连接使用。


  1. 创建好密钥对后,选择刚刚创建好的密钥对,并点击立即创建,等待一段时间后即可启动成功!

例如我创建的时"BaiLetian"。

点击立即创建:

2.服务部署

2.1. 安装 Anaconda

  • 首先,下载安装的脚本:
bash 复制代码
# 下载安装脚本
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
  • 然后,开始安装Anaconda
bash 复制代码
# 安装 Anaconda
bash Miniconda3-latest-Linux-x86_64.sh
  • 接下来,将 Anaconda 目录加入环境变量:
bash 复制代码
# 将 Anaconda 目录加入环境变量
vim ~/.bashrc
export PATH=$PATH:/root/miniconda3/condabin
  • 最后,重新加载环境变量:
bash 复制代码
# 重新加载环境变量
source ~/.bashrc

2.2. Kolors 库下载

  • 安装gif-lfs
bash 复制代码
apt-get install git-lfs
  • 克隆Kolors仓库:
bash 复制代码
git clone https://github.com/Kwai-Kolors/Kolors
  • 进入仓库目录:
bash 复制代码
cd Kolors

2.3. 创建虚拟环境并安装依赖项

  • 创建名为 "kolors" 的虚拟环境并指定 Python 版本为 3.8:
bash 复制代码
conda create --name kolors python=3.8
  • 初始化 bash:
bash 复制代码
conda init bash
  • 激活虚拟环境:
bash 复制代码
 source ~/.bashrc
 conda activate kolors
  • 安装依赖项:
bash 复制代码
pip install -r requirements.txt
  • 安装 Kolors:
bash 复制代码
python3 setup.py install
  • 克隆大文件仓库:
bash 复制代码
git lfs clone https://huggingface.co/Kwai-Kolors/Kolors weights/Kolors

3.生成图片

当服务部署完成后,就可以使用 Kolors 生成图片了。运行以下命令:

bash 复制代码
python3 scripts/sample.py "一个在星空下奔跑的女孩"
# The image will be saved to "scripts/outputs/sample_test.jpg"

生成的图像将保存到 scripts/outputs/sample_test.jpg。你可以根据自己的需求修改文本描述,生成各种精彩的图像。

通过以上步骤,你就可以成功部署和使用 Kolors 文本到图像生成模型了。快来发挥你的创意,创造出令人惊叹的图像作品吧!

相关推荐
DashVector7 分钟前
如何通过HTTP API检索Doc
数据库·人工智能·http·阿里云·数据库开发·向量检索
说私域10 分钟前
无人零售及开源 AI 智能名片 S2B2C 商城小程序的深度剖析
人工智能·小程序·零售
Calvin88082819 分钟前
Android Studio 的革命性更新:Project Quartz 和 Gemini,开启 AI 开发新时代!
android·人工智能·android studio
Jamence1 小时前
【深度学习数学知识】-贝叶斯公式
人工智能·深度学习·概率论
feifeikon1 小时前
机器学习DAY4续:梯度提升与 XGBoost (完)
人工智能·深度学习·机器学习
凡人的AI工具箱1 小时前
每天40分玩转Django:实操多语言博客
人工智能·后端·python·django·sqlite
Jackilina_Stone1 小时前
【自动驾驶】3 激光雷达③
人工智能·自动驾驶
HUIBUR科技1 小时前
从虚拟到现实:AI与AR/VR技术如何改变体验经济?
人工智能·ar·vr
QQ_7781329741 小时前
基于云计算的资源管理系统
人工智能·云计算
伊一大数据&人工智能学习日志2 小时前
OpenCV计算机视觉 01 图像与视频的读取操作&颜色通道
人工智能·opencv·计算机视觉