新年新气象,换个新春照迎龙年!
不藏了,近期全网爆火的 AI 写真项目 InstantID, 正是来自小红书社区技术创作发布团队。
为了迎接龙年春节的到来,我们全新推出「Spring Festival」新春风格,只需上传一张照片,30 秒内轻松定制年味满满的春节写真。
先来看看效果:
跨越千年的问候,"兵马俑"给你拜年了!
蒙娜丽莎在长城练瑜伽,氛围感满满。
爱因斯坦也在故宫前吃起了饺子,恭贺新春。
那如何用 InstantID 制作新春照呢?操作很简单:
-
访问 Hugging Face Spaces 中的 InstantID 地址
-
上传一张照片,InstantID 默认风格为「Spring Festival」,点击 Submit 为你生成一个充满新春气息的照片。
当然,如果你想开启更多的创意玩法,还可以自定义添加 Prompt,风格自由搭配。
比如,这是费雯丽的照片,选择「Spring Festival」风格,未添加 Prompt 的效果。
为照片添加一些"魔法"------龙年春节自然少不了龙年元素,感受一下吃饺子、发红包、雪中赏梅的节日氛围。同一张照片,输入不同的 Prompt,30 秒照片焕新。
InstantID 很好地保留费雯丽的面部特征,仔细一看,甚至能还原手部动作、模拟飘雪时风吹动头发的动态效果。
不仅如此,我们还可以上传姿势图为参考,InstantID 生成的绝美侧仰照,很有神韵。
除新春主题外,InstantID 还有非常多的有趣玩法。比如让深度学习大牛、图灵奖获得者 Yann LeCun 变身为经典动漫角色,马里奥、海贼王...
按一年四季,随机生成你的动漫人格,脸部可幼态可成熟。
InstantID 尽情释放你的想象力,来套中国功夫对抗赛,也不是不可以~
InstantID 最独特的地方在于它只需要一张照片,不依赖模型,用时 30 秒就可以生成非常不错的风格效果。从效果和使用体验上来看,InstantID 作为一个高效的、轻量级、可插拔的适配器,赋予预训练的文本到图像扩散模型以 ID 保存的能力。
前不久,小红书技术团队的 5 位工程师发表论文,详细揭秘了 InstantID 背后的技术。
那为什么只需上传一张图 + 简单的提示,InstantID 就能实现高面部保真度,画面与人物统一得很和谐呢?
核心关键是 InstantID 不训练文生图模型的 UNet 部分,仅训练可插拔模块,在推理过程中无需 test-time tuning,在几乎不影响文本控制能力的情况下,实现高保真 ID 保持。
如图所示,我们通过一系列创新技术:弱对齐的 CLIP 特征替换为强语义的人脸特征、人脸图像的特征在 Cross-Attention 中作为 Image Prompt 嵌入、 以及 IdentityNet 来对人脸施加强语义和弱空间的条件控制,InstantID 在不牺牲文本控制能力的情况下,实现了高保真 ID 保持。
Instant 在多个方面展现出其独特优势,我们提出的主要贡献如下:
-
提供了一种全新的 ID 保留方法,有效弥补了训练效率与 ID 保真度之间的差距。
-
InstantID 是可插拔的,与目前社区内文生图基础模型、LoRAs、ControlNets 等完全兼容,可以零成本地在推理过程中保持人物 ID 属性。此外,InstantID 保持了良好的文本编辑能力,使 ID 能够丝滑地嵌入到各种风格当中。
-
实验结果表明,InstantID 不仅超越目前基于单张图片特征进行嵌入的方法(IP-Adapter-FaceID),还与 ROOP、LoRAs 等方法在特定场景下不分伯仲。它卓越的性能和效率激发了其在一系列实际应用中的巨大潜力,例如新颖的视图合成、ID 插值、多 ID 和多风格合成等。
还不赶紧上手体验一下,自定义你的春节写真。
Prompt 不知道怎么写?一些好用的"咒语",拿走不谢~ 也欢迎在评论区晒出你的 Prompt。
-
Flat illustration, a Chinese girl, ancient style, wearing a red cloth, smile face, white skin, clean background, fireworks blooming, red lanterns.
-
A man riding a colossal fire-breathing dragon, engaging in a space battle against extraterrestrial beings.
-
A person dressed as a superhero, backed by a bizarre alliance of politicians, celebrities, and animals, defending Earth together.
-
A girl wearing cheongsam, Milky Way, wind, spring festival, cartoon, red backgroud, Red Lantern, fireworks, smile, dressed, Chinese dragon.
另外,今年春节期间,2 月 7 日 至 25 日,我们与著名开源模型社区 Hugging Face 联手,在小红书 APP 上,特别策划「你的新春照我包了」有奖互动。
参与方式:
**
**
-
在小红书 APP 内分享你用 InstantID 生成的新春照。
(体验入口指路👉huggingface.co/spaces/Inst...
-
带 #你的新春照我包了 话题发笔记,并关注和 @Hugging Face 小红书账号,让更多人看到你的创意。
-
晒出你的 Prompt,分享你的新年愿望和期待,邀请朋友和家人一起参与,拼出新春照一条龙。
活动奖励:
-
我们将根据参与笔记的互动和创意,送出由 小红书技术REDtech 和 Hugging Face 提供的新年礼物!
-
优质笔记将获得专属活动流量扶持,惊喜多多。
我们相信,通过开源,InstantID 能够激发更多开发者的创造力,推动 AI 技术的进一步发展,同时也让更多人享受到科技带来的便利和乐趣。
准备好了吗?一起来玩 InstantID,这个新年,因你而不同!
- 论文标题:InstantID: Zero-shot Identity-Preserving Generation in Seconds
- 论文地址:arxiv.org/abs/2401.07...
- 代码地址:github.com/InstantID/I...
- 项目地址:instantid.github.io
- Demo 新春体验:huggingface.co/spaces/Inst...