- 作者:陈大鱼头
- github:github.com/KRISACHAN
- 邮箱:chenjinwen77@gmail.com
- Seedream 4.0 体验地址:event1.cn/5LGO92
前言
如果大家有关注 AI 生图领域的话,一定知道 9 月 9 日字节跳动旗下的 Seed 团队正式推出了豆包·图像创作模型 Seedream 4.0。
Seedream 4.0 是一个从生成到编辑的一站式图像创作模型。
它的优势是:
- 首次支持4K多模态生图 ,灵活支持文本、图像的组合输入,实现多图融合创作、参考生图、组合生图、图像编辑等核心能力,且主体一致性大幅增强。
- 推理速度较 Seedream 3.0 提升超 10 倍,可实现最快秒级生成2K图片。
并且在9.11日晚,一举拿下了Artificial Analysis「文生图」和「图像编辑」两大榜单的第一。

按使用指南说的,它的亮点是:
- 精准指令编辑
- 高度特征保持
- 深度意图理解
- 多图输入输出
- 超高清
话不多说,我们通过几个例子来体验一下它的能力!
Seedream 4.0 体验地址:event1.cn/5LGO92
单图图生图
首先我们看用一张图生成目标图的能力。下面是我在网上找了一张图:

图片来自彼岸图网
然后输入以下 Prompt:
txt
根据这张图片做一个动漫人物手办,放在桌上,后面放置一个印有角色图像的生日礼物包装盒,盒子下面有一本书,在包装盒前面,添加一个圆形塑料底座,角色手办站在上面,将场景设置在室内,尽可能真实;生成尺寸和现在图一样;手办在图片的左边;整个图片的风格和原始图一样。
回车!

效果有点吓人,这么复杂的服饰跟姿势,简单的一句 Prompt,就这样水灵灵地创作出非常逼真的虚拟形象。
等下,如果我换个动作呢?我换个 Prompt 试一下:
txt
请将女生的手势变成比心

姿势也能精准理解跟生成,太惊艳了。
感觉以后需要婚纱照或者艺术照套图的时候,都不用像以前那样一个服饰拍 N 小时了,直接拍一张高清底图,然后让 Seedream 4.0 生成对应的图片就好了。
多图图生图
单图的效果很惊讶,那么多图的场景呢?还能打吗?
接下来除了上面的图,我再找多一个素材来呢?

然后输入下方的 Prompt 进行融合:
txt
参考图2的风格,将图1做风格转换,要注意不要错过任何图1 的人物细节。

那如果是合影呢?
等我加上这张照片康康!

图片来自彼岸图网
txt
让两张图片中的人物合影,背景使用图一的背景,我希望她们两个能够深情对望。

这。。。这效果也太没有违和了吧。。太强了,我折服了!
连续生图
再来点刺激的连续生图能力。
在进入创作之前先说明一下这个连续生图的能力:
在对话里提供了故事书和连环画功能,该功能结合了 doubao-seed-1.6 模型和 doubao-seedream-4.0 模型,可实现一句话生成动漫、连环画、故事书,满足用户多样化的创作需求。
直接在聊天框切换就行,很简单。

话不多说,同样还是用上面的两幅图,我们写个故事。
txt
用这两个角色创作一个双女主互相救赎的故事,故事分为 9 部分,包含 9 张图像,每一张图是一部分,不要在图像中包含任何文字或文本,纯粹通过图像本身讲述故事,图与图之间故事要连贯。故事大纲是:图一的女生是一名武功高强的侠女,图二的女生是充满智慧的丞相嫡女。两人惺惺相惜,以闺蜜相称。最终在两人的合作下粉碎了阴谋者亡国的阴谋,救赎了国家。
我们先看看自动组图模式输出的结果:

接下来是连环画模式:

我们再看看故事书模式输出的结果:

在 UI 展示上还挺好看的,就是内容有点短。
大家想看的话可以扫描下方二维码直接观看!

从整体表现来看,连续生图的能力还是非常惊艳的,生成的效果很好,重点就是确实有连续故事性,就是内容再长一些就好了!
美化与精修
相信通过上方的 DEMO,各位已经非常直观地看到 **Seedream 4.0 ** 的效果了。
唔,接下来我要试试它能不能实现 PS 的重磅能力 --- 美颜!

在保持人物形象,表情,动作,背景不变的前提下,帮我给图中女生一键美颜,我需要祛痘+磨皮+瘦脸+美白+淡妆。

厉害。。。以前精修个图快也要几十分钟,现在只要 1 分钟就可以了,对于普通人来说,基本可以告别 PS 修图了。
再试试完整的精修+妆容+滤镜。
txt
在保持人物形象、表情、动作、背景不变的前提下,给图中女生精修:打造哑光底妆,祛斑祛痘、微微磨皮、去油光;妆容上画深邃大地色眼影、浓密睫毛、上挑眼线,涂雾面裸棕色口红,整体偏90年代港女风;优化脸型五官,调整为大波浪发型,再将画面光影改为光影斑驳。

天。。还要什么自行车,我感觉我都要恋爱了!
PS:各位直男同学再也不用担心因为不懂拍照修图被女朋友骂了,现在有救了。
文生图
有图生图的效果我能打 90 分。。。扣 10 分我怕 seedream 4.0 骄傲!
接下来再看看文生图的效果。
我试试这个 Prompt:
txt
一位古风侠女,身处古朴的木质栈道,背后是飞泻的瀑布与弥漫的云雾。她身着赤色劲装,外罩玄铁软甲,皮革护腕简约大气。腰系镶嵌宝石的腰带,剑穗随风轻摆。头发高束成利落马尾,插着狼牙发簪。面部妆容为眉间点朱砂,眼神冷峻坚毅,英气十足。
一键生成:

如果再加一些定向的背景呢?
txt
高束马尾(插狼牙簪)的侠女眉间点朱砂,眼神冷峻,身着赤色劲装与玄铁软甲,配深棕皮革护腕和镶宝石腰带,斜挎的长剑挂着墨色剑穗。她身处带包浆与青苔的古朴木质栈道上,背景是飞泻的瀑布与弥漫的云雾,正与 3-4 名山贼战斗,动作定格在 "侧身避刀、拔剑 1/3、左臂格挡" 的瞬间。整体为电影级质感,色调呈暗调(深褐、墨绿、赤色),光线以弱光为主,主光源是瀑布顶端的散射天光,在软甲、剑穗、宝石上形成高光,暗部则用云雾微光与木板光斑补充细节。

嗯,效果也非常好!
后记
想快速体验的同学可以直接访问:event1.cn/5LGO92
关于更多的使用指南可以查看 豆包 Seedream 4.0 使用指南
当前我只是简单尝试一下 Seedream 4.0 ,实际上它的能力远不至于我当下呈现的。
我也非常希望,也推荐大家多去探索它的能力,看它能做什么,不能做什么,边界在哪里。
在我一通尝试下来,我认为 Seedream4.0 以及 nano banana 绝对是生图领域的 GPT3.5。
在核心能力上,这两者肯定是差不多的,而且 Seedream4.0 对中文更加友好,更符合国人体质。
从 GPT 3.5 到 DeepSeek V3,我们走了 2 年。
但是从nano banana 到 Seedream4.0 其实只有短短不到一个月的时间,这是很震撼的!
正如它的名字一样,让我真的看到了梦在实现。是全民创作者的梦想。