黑森林研究所提出KV缓存方式让生图模型能更好地多参考编辑


FLUX.2 [klein] 9B-KV 是 FLUX.2 [klein] 9B 的优化版本,具备KV缓存加速多参考图编辑功能。该变体在首次去噪步骤中缓存参考图的键值对,消除后续步骤的冗余计算,显著加速多图编辑流程。

了解更多 FLUX.2 [klein] 信息,请阅读我们的博客文章

核心特性

  1. KV缓存优化:参考图键值对仅计算一次并缓存,多参考图编辑任务可减少计算量,推理速度提升高达2.5倍
  2. 完整保留 FLUX.2 [klein] 9B 所有能力:亚秒级生成、文生图、多参考图编辑的统一模型
  3. 特别适合需要重复使用相同参考图的交互式应用和实时编辑场景
  4. 90亿参数流模型,搭配80亿参数Qwen3文本编码器,通过步数蒸馏实现4步推理
  5. 仅供非商业用途使用

KV缓存原理

标准图像编辑流程会在每个去噪步骤重复处理参考图token。采用KV缓存后:

  • 步骤0:完整前向传播处理参考图token,提取键值对存入缓存
  • 步骤1-3:复用缓存键值对,跳过冗余的参考图token计算

该技术特别适用于:

  • 多参考图编辑场景
  • 使用相同参考图生成变体
  • 开发交互式编辑应用

使用方式

我们在GitHub仓库提供了参考实现。

API接口

可通过 BFL API 使用 FLUX.2 [klein] 9B-KV,访问 bfl.ai

搭配Diffusers 🧨使用

如需通过 🧨 Diffusers python库使用 FLUX.2 [klein] 9B-KV,请先安装或升级diffusers:

shell 复制代码
pip install git+https://github.com/huggingface/diffusers.git

然后你可以使用Flux2KleinKVPipeline来运行模型:

python 复制代码
import torch
from diffusers import Flux2KleinKVPipeline

device = "cuda"
dtype = torch.bfloat16
model_path = "black-forest-labs/FLUX.2-klein-9b-kv"

pipe = Flux2KleinKVPipeline.from_pretrained(model_path, torch_dtype=dtype)
pipe.to(device)

# Text-to-image (no reference image)
print("Generating text-to-image...")
image = pipe(
    prompt="A cat holding a sign that says hello world",
    height=1024,
    width=1024,
    num_inference_steps=4,
    generator=torch.Generator(device=device).manual_seed(0),
).images[0]
image.save("t2i_output.png")
print("Saved t2i_output.png")

# Image-to-image with KV cache (using the generated image as reference)
print("Generating image-to-image with KV cache...")
image_kv = pipe(
    prompt="A cat dressed like a wizard",
    image=image,
    height=1024,
    width=1024,
    num_inference_steps=4,
    generator=torch.Generator(device=device).manual_seed(0),
).images[0]
image_kv.save("kv_output.png")
print("Saved kv_output.png")

局限性

  • 本模型不具备亦不意图提供事实性信息
  • 生成的文本内容可能存在不准确或失实表述
  • 作为统计模型可能反映或放大训练数据中的偏见
  • 存在无法按提示要求生成内容的情况
  • 输出结果对提示风格极为敏感

禁止用途

依据使用政策规定,禁止将本模型及其衍生品用于违法、欺诈、诽谤、滥用等违反许可协议的用途。

硬件要求

FLUX.2 [klein] 9B-KV模型需约29GB显存,需配备NVIDIA RTX 5090及以上显卡。


负责任AI开发

黑森林实验室致力于负责任的模型开发与部署。在发布FLUX.2 [klein] 9B-KV前,我们已评估并缓解了包括儿童性虐待材料(CSAM)和非自愿亲密影像(NCII)在内的多项风险。完整评估流程、内容溯源功能及政策详见博文:强大、开放与安全:防范AI滥用

安全事项举报请联系:safety@blackforestlabs.ai


许可协议

本模型采用FLUX非商业许可

商标与知识产权

本项目可能包含相关项目的商标或标识。修改版本中使用黑森林实验室及FLUX商标时不得暗示官方授权。第三方商标及知识产权的使用受相关方政策约束。

相关推荐
努力努力再努力FFF4 分钟前
医生对AI辅助诊断感兴趣,作为临床人员该怎么了解和学习?
人工智能·学习
AI医影跨模态组学17 分钟前
如何将纵向MRI深度学习特征与局部晚期直肠癌新辅助放化疗后的免疫微环境建立关联,并解释其对pCR及预后的机制
人工智能·深度学习·论文·医学·医学影像·影像组学
Empty-Filled18 分钟前
AI生成测试用例功能怎么测:一个完整实战案例
网络·人工智能·测试用例
eastyuxiao18 分钟前
设计一个基于 OpenClaw 的 AI 智能体来辅助交易
人工智能
波动几何1 小时前
因果动力学架构技能cda
人工智能
Lucas_coding1 小时前
【Claude Code Router】 Claude Code 兼容 OpenAI 格式 API, Claude code 接入本地部署模型
人工智能·python
jinanwuhuaguo1 小时前
(第二十七篇)OpenClaw四月的演化风暴:OpenClaw 2026年4月全版本更新的文明级解读
大数据·人工智能·架构·kotlin·openclaw
计算机魔术师1 小时前
【AI面试八股文 Vol.1.3:ReAct】ReAct 不是一种算法,是一种工程契约:从问题域到面试追问的完整映射
开源
测试员周周1 小时前
【AI测试系统】第5篇:从 Archon 看 AI 工程化落地:为什么"确定性编排+AI 弹性智能"是终局?
人工智能·python·测试
RxGc1 小时前
微软AI Agent框架深度测评:Microsoft Agent Framework 1.0 vs OpenClaw/Claude企业级能力对比
人工智能·agent