OpenBayes 教程上新丨一句话精准P图,FLUX.1 Kontext可实现图像编辑/风格迁移/文本编辑/角色一致性编辑

一句话 P 图的时代终于来了。

2025 年 5 月底,沉寂已久的 Black Forest Labs 发布了新模型 FLUX.1 Kontext,并于近日宣布开源。其基于流匹配架构,支持上下文内图像生成,可以同时使用文本和图像进行提示,并无缝提取和修改视觉概念,从而生成新的、连贯的图像。从功能的角度来看,FLUX.1 Kontext 能够在无需复杂描述的情况下实现多种编辑任务,包括对象修改、风格转换、背景替换、角色一致性编辑和文本编辑等。

此外,FLUX.1 Kontext 在扩展功能的同时还极大地提高了性能。在 KontextBench 上的人工评测显示,FLUX.1 Kontext 在多数类别中表现优于现有开源模型闭源模型,可以说 FLUX.1 Kontext 已成为了图像生成模型里的新标杆。

六项上下文图像生成任务中的测评

目前,「FLUX.1-Kontext-dev:文本驱动的一键图像编辑」 教程已上线至 OpenBayes 公共教程中,点击下方链接即可一键部署。

教程地址:

go.openbayes.com/VyN7

小贝总专属邀请链接(直接复制到浏览器打开):

go.openbayes.com/9S6Dr

Demo 运行

01 Demo 运行阶段

1.登录 OpenBayes,在「公共教程」页面,选择键部署「FLUX.1-Kontext-dev:文本驱动的一键图像编辑」教程。

2.页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

3.选择「NVIDIA RTX A6000」以及「PyTorch」镜像,OpenBayes 平台提供了 4 种计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。新用户使用下方邀请链接注册,可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费时长!

小贝总专属邀请链接(直接复制到浏览器打开):

go.openbayes.com/9S6Dr

4.等待分配资源,首次克隆需等待 2 分钟左右的时间。当状态变为「运行中」后,点击「API 地址」旁边的跳转箭头,即可跳转至 Demo 页面。由于模型较大,需等待约 3 分钟显示 WebUI 界面,否则将显示「Bad Gateway」。请注意,用户需在实名认证后才能使用 API 地址访问功能。

02 效果演示

进入模型页面后,首先上传一张图片,然后输入生成图片的提示词,设置好参数,最后点击「Run」生成。

注:项目提示词仅支持英语。

图源:X 平台用户 ( fan ) Elonmusk

相关推荐
知行力37 分钟前
百度PaddleOCR-VL:基于0.9B超紧凑视觉语言模型,支持109种语言,性能超越GPT-4o等大模型
人工智能·百度·1024程序员节
deephub39 分钟前
vLLM 性能优化实战:批处理、量化与缓存配置方案
人工智能·python·大语言模型·1024程序员节·vllm
云飞云共享云桌面1 小时前
东莞精密机械制造工厂5个SolidWorks设计共享一套软件
运维·服务器·网络·人工智能·自动化·制造
Theodore_10221 小时前
机器学习(9)正则化
人工智能·深度学习·机器学习·计算机视觉·线性回归·1024程序员节
莫叫石榴姐1 小时前
半导体晶圆制造关于设备制程几个核心概念及映射关系
人工智能·机器学习·制造
Theodore_10221 小时前
机器学习(10)L1 与 L2 正则化详解
人工智能·深度学习·机器学习·梯度下降·1024程序员节
2501_927283581 小时前
WMS市场中的专业力量:为何天津荣联汇智是制造企业的重点关注对象
运维·人工智能·机器人·自动化·制造·agv
梵得儿SHI1 小时前
大型语言模型基础之 Prompt Engineering:打造稳定输出 JSON 格式的天气预报 Prompt
人工智能·语言模型·prompt·提示词工程·结构化输出·engineering·ai交互
赋创小助手1 小时前
“短小精悍”的边缘AI算力利器:超微SYS-E403-14B-FRN2T服务器评测
服务器·人工智能·科技·ai·架构·边缘计算·1024程序员节
叶庭云1 小时前
一文了解开源大语言模型文件结构,以 Hugging Face DeepSeek-V3.1 模型仓库为例
人工智能·大语言模型·hugging face·1024程序员节·llms·开源模型文件结构·deepseek-v3.1