一、闭源商用底模
表格
| 模型名称 | 开发商 | 核心特点 | 适用场景 | 备注 |
|---|---|---|---|---|
| Flux.2 Max | Black Forest Labs | 320 亿参数,4MP 细节,强语义理解,支持 JSON / 色值提示词,光影材质顶级 | 商业设计、电影概念、广告大片、高保真写实 | 2025.11 发布,当前画质天花板,BFL API 调用 |
| GPT Image 1.5 | OpenAI | 基于 GPT-4.1,文本理解极强,逻辑构图严谨,多模态联动 | 品牌营销、复杂叙事插画、图文协同创作 | 2026 年初更新,DALL・E 3.5 升级版,ChatGPT 集成 |
| Gemini 3 Pro Image | 多模态融合,实时场景理解,动态光影,视频转图能力突出 | 影视分镜、AR/VR 素材、动态内容生成 | 2026 年初发布,Google 生态深度整合 | |
| Midjourney v7 | Midjourney | 艺术感与风格化极强,社区生态庞大,出图稳定,迭代快 | 艺术创作、插画、概念设计、社交媒体配图 | Discord 平台,v7 于 2025 年底更新,风格多样性领先 |
| Hunyuan Image 3.0 | 腾讯 | 亚洲审美、国风 / 动漫优势,人物一致性好,多语言支持 | 国风创作、二次元、亚洲人像、游戏美术 | 2026 年初发布,国内头部闭源模型 |
| Seedream 4.5 | 字节跳动 | 视频转图、动作生成,电商 / 短视频适配,速度快 | 短视频素材、电商主图、动态海报 | 2026 年初更新,剪映生态联动 |
| 文心 ERNIE-ViLG 4.0 | 百度 | 中文理解优秀,国风 / 水墨突出,企业版成本低 | 国风设计、国内品牌营销、政务宣传 | 国内老牌,API 成熟,性价比高 |
| 通义万相 | 阿里 | 电商商品图生成效率高,UI / 图标适配,阿里云生态 | 电商详情页、UI 设计、品牌视觉 | 与阿里云、淘宝生态打通,商业化成熟 |
二、开源底模
1. Flux 系列(BFL,当前开源画质标杆)
- Flux.2 [Dev]:320 亿参数,开源非商用,细节 / 语义拉满,支持本地微调,适合研究与高质量创作。
- Flux.2 [klein]:40 亿参数,Apache 2.0 可商用,6GB + 显存流畅,亚秒级推理,普惠级部署首选(2026.1.15 发布)。
- Flux.1 [Dev]:120 亿参数,开源非商用,生态成熟,LoRA/ControlNet 完善,性价比高。
- Flux.1 [Schnell]:1-4 步极速生成,Apache 2.0 可商用,低显存友好,适合批量出图。
2. Stable Diffusion 系列(Stability AI,生态最完善)
- SD 3.5:最新官方旗舰,文本遵循、细节、速度全面提升,支持多尺寸,闭源 API + 部分开源,商业友好。
- SDXL 1.0/1.1:1024px 原生,画质 / 构图优于 SD 1.5,开源,社区模型(如 DreamShaper XL)丰富,适合通用创作。
- SD 1.5:经典老版,生态无敌(LoRA / 插件最多),4GB + 显存可跑,适合新手、风格化创作与低配置设备。
3. 国产开源(中文 / 国风优势)
- Qwen-Image(Z-Image):阿里,6B 参数,中文文本渲染精准(无乱码),8GB 显存可用,支持 LoRA,海报 / UI 神器。
- Kandinsky 5.0:俄罗斯 SberAI,多语言(含中文),16 步生成 1408px,视频能力突出,跨文化创作适配。
4. 社区精品底模(基于 SD/Flux 微调,风格化强)
- DreamShaper XL:SDXL 基座,全能写实,光影细腻,通用场景首选(Civitai 热门)。
- Chilloutmix:SD 1.5 基座,亚洲真人写实,下载量超 70 万,人像 / 写真爆款。
- Counterfeit-V3.0:SD 1.5 基座,日漫二次元天花板,线条 / 色彩精准,ACG 创作必备。
- Anime Art Diffusion XL:SDXL 基座,现代动画风格,大尺寸人物优质,光影出色。
三、选型速览
- 极致画质 / 商业设计 → Flux.2 Max、GPT Image 1.5、Gemini 3 Pro Image
- 本地部署 / 可商用 → Flux.2 [klein]、Flux.1 [Schnell]、SD 3.5(商用版)
- 中文 / 国风 / 海报 → Qwen-Image、文心 ERNIE-ViLG 4.0、Hunyuan Image 3.0
- 二次元 / ACG → Counterfeit-V3.0、Anime Art Diffusion XL、Hunyuan Image 3.0
- 低显存 / 新手 → SD 1.5、Flux.1 [Schnell]、Flux.2 [klein]
- 艺术风格 / 创意 → Midjourney v7、Flux 系列、DreamShaper XL
四、核心差异总结
- 闭源:质量顶尖、无需部署、付费 API,适合快速出图与商业项目。
- 开源:可本地运行、定制化强、成本低,适合研究、批量生成与隐私场景。
- Flux vs SD:Flux 画质 / 细节领先,SD 生态 / 兼容性无敌,国产模型中文 / 国风优势明显。