【Datawhale X 魔搭 】AI夏令营第四期AIGC方向,Task1:可图Kolors-LoRA风格AI图片生成入门(持续更新)

第一步:下载baseline文件

(1)安装lfs,用于git脚本命令下载大文件

git lfs install
在AI模型和数据集中,通常包含一些较大的文件,例如图像或模型参数。这些文件可能会超过普通Git仓库的处理能力。git lfs 可以帮助你管理和下载这些大文件,确保你的项目能够顺利运行。

Git LFS(Large File Storage)是一个用于Git版本控制系统的扩展 ,它专门用来管理大型文件,如图像、音频和视频文件。

Git LFS的主要功能和优势包括:

  1. 缩小仓库尺寸:LFS通过仅在Git仓库中存储大文件的文本指针来减小仓库的大小。实际的文件内容存储在Git LFS服务器上,而不是本地仓库中,这样可以显著减少本地仓库的体积。
  2. 提高性能:因为大文件的实际内容并没有直接存储在Git历史记录中,所以使用Git LFS可以加快克隆、拉取和推送操作的速度,尤其是对于那些包含大量大型文件且经常修改的项目。
  3. 更好的大文件管理:Git LFS为大文件提供了更高效的管理方式,使得这些文件的版本控制更加便捷,同时减少了对磁盘空间的占用和网络带宽的需求。

(2)下载kolors项目代码

git clone https://www.modelscope.cn/datasets/maochase/kolors.git

第二步: 打开kolors项目,双击打开baseline.ipynb

第三步:按照LoRA 样例脚本,一步一步执行命令

注意:手动重启 Notebook kernel的按钮在这里,如下截图

最后的脚本,是用来可视化展示生成的8张二次元图片的。

第四步:魔搭社区上传模型,以下是我上传的模型

https://www.modelscope.cn/models/mtrycatch/xbrmlzwh-LoRA-xsrm

执行脚本:

mkdir /mnt/workspace/kolors/output & cd

cp /mnt/workspace/kolors/models/lightning_logs/version_0/checkpoints/epoch\=0-step\=500.ckpt /mnt/workspace/kolors/output/

cp /mnt/workspace/kolors/1.jpg /mnt/workspace/kolors/output/

分别右键下载这两个文件,后续上传模型要用。

第五步:进入魔搭社区,创建自己的模型,记得一定要选择公开模型

模型效果示例:上传刚下载的jpg图片,1.jpg

Lora权重:上传刚下载的ckpt文件,epoch=0-step=500.ckpt

尤其注意点,完成任务后,记得关闭实例!!!否则会一直消耗算力。

相关推荐
墨风如雪10 小时前
阿里Qwen3-VL双子星开源:图文视频混合检索的“降维打击”
aigc
EdisonZhou13 小时前
MAF快速入门(11)并行工作流
llm·aigc·agent·.net core
职业码农NO.115 小时前
AI 技术栈完整解析,从 GPU 到应用的五层架构
人工智能·架构·系统架构·aigc·agent
TOPGUS15 小时前
黑帽GEO手法揭秘:AI搜索阴影下的新型搜索劫持与风险
人工智能·搜索引擎·chatgpt·aigc·谷歌·数字营销
桂花饼17 小时前
量化双雄争霸:九坤 IQuest-Coder-V1 的技术突破
人工智能·aigc·nano banana 2·openai兼容接口·claude opus 4.5·sora2 pro
undsky_17 小时前
【n8n教程】:RSS Feed Trigger节点,玩转RSS订阅自动化
人工智能·ai·aigc·ai编程
用户51914958484518 小时前
深入剖析CVE-2025-41115:Grafana企业版SCIM特权升级漏洞利用实践
人工智能·aigc
猫头虎19 小时前
Claude Code 永动机:ralph-loop 无限循环迭代插件详解(安装 / 原理 / 最佳实践 / 避坑)
ide·人工智能·langchain·开源·编辑器·aigc·编程技术
沛沛老爹19 小时前
Skills高级设计模式(一):向导式工作流与模板生成
java·人工智能·设计模式·prompt·aigc·agent·web转型
Mintopia21 小时前
🎙️ React Native(RN)语音输入场景全解析
android·react native·aigc