
Qwen-Image-2512 是 Qwen-Image 文生图基础模型的 12 月更新版本,这是一个最新的文本生成图像模型,特点是 画面更真实、细节更精致,提升了人物与自然细节的真实感,适合在创意设计、教育展示、内容生产等领域使用。
今天分享的 Qwen-Image-2512 V2版 一键包基于阿里最新开源的 Qwen-Image-2512 的FP8量化版(同时支持BF16),支持消费级显卡最低12G显存流畅运行,支持更适合小白操作的WebUI模式和专业选手的ComfyUI两种模式。
相比较上个版本,V2版因使用精度更高的FP8模型,所以在生成效果上更好,同时对硬件的要求也更高,大家根据需要选择适合自己的版本。
下载地址:点此下载
模型特点
更真实的人物表现:相比旧版本,人物的面部细节、表情和环境都更自然,不再有明显的"AI感"。
更精细的自然细节:风景、动物毛发、水流等元素渲染更逼真,层次感更强。
更准确的文字渲染:在生成带文字的图像(如海报、PPT)时,排版和字体更清晰,图文融合更好。
更强的整体性能:在超过一万次盲测中,表现优于大多数开源模型,甚至接近闭源顶级模型。
应用领域
创意设计:用于插画、广告、海报、角色设定。
教育与培训:生成教学用图、科普展示、信息图表。
内容生产:辅助媒体、社交平台快速生成高质量配图。
虚拟场景构建:游戏、美术、影视前期概念设计。
使用教程: (建议N卡,显存12G起,支持50系显卡)
整合包包含所需所有节点,下载主程序和模型(ComfyUI文件夹),解压主程序一键包,将ComfyUI文件夹移动到主程序目录下即可。
支持自定义模型切换,模型下载 ,显卡≥16G显存的用户,可以使用更高精度的BF16模型,生成效果最佳。
WebUI:启动后,输入提示词,设置参数,生成即可。
ComfyUI工作流:
双击启动,浏览器输入 http://127.0.0.1:8188/ 进入页面后,点击左侧的 工作流程,选择对应的工作流,如需切换模型,UNET加载器切换自己需要的模型
输入提示词,设置参数,最后运行即可。
支持Lora扩展,目前少有支持Qwen-Image-2512的lora模型,webui和comfyui都留有lora支持,后期有对应lora模型,可以直接使用。
软件目录结构
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │ └── qwen_image_2512_fp8_e4m3fn.safetensors
│ ├── 📂 text_encoders/
│ │ └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│ ├── 📂 loras/
│ │ └── Qwen-Image-2512-Lightning-4steps-V1.0-bf16.safetensors
📂 deepface/
......