黑森林研究所提出KV缓存方式让生图模型能更好地多参考编辑


FLUX.2 [klein] 9B-KV 是 FLUX.2 [klein] 9B 的优化版本,具备KV缓存加速多参考图编辑功能。该变体在首次去噪步骤中缓存参考图的键值对,消除后续步骤的冗余计算,显著加速多图编辑流程。

了解更多 FLUX.2 [klein] 信息,请阅读我们的博客文章

核心特性

  1. KV缓存优化:参考图键值对仅计算一次并缓存,多参考图编辑任务可减少计算量,推理速度提升高达2.5倍
  2. 完整保留 FLUX.2 [klein] 9B 所有能力:亚秒级生成、文生图、多参考图编辑的统一模型
  3. 特别适合需要重复使用相同参考图的交互式应用和实时编辑场景
  4. 90亿参数流模型,搭配80亿参数Qwen3文本编码器,通过步数蒸馏实现4步推理
  5. 仅供非商业用途使用

KV缓存原理

标准图像编辑流程会在每个去噪步骤重复处理参考图token。采用KV缓存后:

  • 步骤0:完整前向传播处理参考图token,提取键值对存入缓存
  • 步骤1-3:复用缓存键值对,跳过冗余的参考图token计算

该技术特别适用于:

  • 多参考图编辑场景
  • 使用相同参考图生成变体
  • 开发交互式编辑应用

使用方式

我们在GitHub仓库提供了参考实现。

API接口

可通过 BFL API 使用 FLUX.2 [klein] 9B-KV,访问 bfl.ai

搭配Diffusers 🧨使用

如需通过 🧨 Diffusers python库使用 FLUX.2 [klein] 9B-KV,请先安装或升级diffusers:

shell 复制代码
pip install git+https://github.com/huggingface/diffusers.git

然后你可以使用Flux2KleinKVPipeline来运行模型:

python 复制代码
import torch
from diffusers import Flux2KleinKVPipeline

device = "cuda"
dtype = torch.bfloat16
model_path = "black-forest-labs/FLUX.2-klein-9b-kv"

pipe = Flux2KleinKVPipeline.from_pretrained(model_path, torch_dtype=dtype)
pipe.to(device)

# Text-to-image (no reference image)
print("Generating text-to-image...")
image = pipe(
    prompt="A cat holding a sign that says hello world",
    height=1024,
    width=1024,
    num_inference_steps=4,
    generator=torch.Generator(device=device).manual_seed(0),
).images[0]
image.save("t2i_output.png")
print("Saved t2i_output.png")

# Image-to-image with KV cache (using the generated image as reference)
print("Generating image-to-image with KV cache...")
image_kv = pipe(
    prompt="A cat dressed like a wizard",
    image=image,
    height=1024,
    width=1024,
    num_inference_steps=4,
    generator=torch.Generator(device=device).manual_seed(0),
).images[0]
image_kv.save("kv_output.png")
print("Saved kv_output.png")

局限性

  • 本模型不具备亦不意图提供事实性信息
  • 生成的文本内容可能存在不准确或失实表述
  • 作为统计模型可能反映或放大训练数据中的偏见
  • 存在无法按提示要求生成内容的情况
  • 输出结果对提示风格极为敏感

禁止用途

依据使用政策规定,禁止将本模型及其衍生品用于违法、欺诈、诽谤、滥用等违反许可协议的用途。

硬件要求

FLUX.2 [klein] 9B-KV模型需约29GB显存,需配备NVIDIA RTX 5090及以上显卡。


负责任AI开发

黑森林实验室致力于负责任的模型开发与部署。在发布FLUX.2 [klein] 9B-KV前,我们已评估并缓解了包括儿童性虐待材料(CSAM)和非自愿亲密影像(NCII)在内的多项风险。完整评估流程、内容溯源功能及政策详见博文:强大、开放与安全:防范AI滥用

安全事项举报请联系:safety@blackforestlabs.ai


许可协议

本模型采用FLUX非商业许可

商标与知识产权

本项目可能包含相关项目的商标或标识。修改版本中使用黑森林实验室及FLUX商标时不得暗示官方授权。第三方商标及知识产权的使用受相关方政策约束。

相关推荐
墨染天姬10 分钟前
【AI】如何基于cursor创建MCP索引pdf
人工智能·pdf
数字供应链安全产品选型12 分钟前
AI造“虾”易,治理难?悬镜多模态 SCA 技术破局 AI 数字供应链治理困局!
人工智能·安全·网络安全·ai-native
火山引擎开发者社区13 分钟前
只需聊聊天,应用就上线:ArkClaw 对话开发与 IGA Pages 极速部署实践
人工智能
昨夜见军贴061615 分钟前
AI报告编审解决方案重塑工作节奏:IA-Lab AI检测报告生成助手与IACheck让报告处理从紧张走向从容
人工智能
芯智工坊15 分钟前
第13章 Mosquitto监控与日志管理
前端·网络·人工智能·mqtt·开源
小红的布丁17 分钟前
Redis 持久化详解:AOF、RDB 与混合持久化如何平衡性能和可靠性
数据库·redis·缓存
扬帆破浪17 分钟前
开源的WPS AI文档编审软件适用场景:察元 AI 文档助手
人工智能·开源
爱学习的小仙女!23 分钟前
机器学习面试题(二) 损失函数 常见损失函数
人工智能·机器学习
墨染天姬24 分钟前
【AI】注意力机制
人工智能
quetalangtaosha29 分钟前
Anomaly Detection系列(CVPR2025 DeCo-Diff论文解读)
人工智能·计算机视觉·异常检测