一句话 P 图,在 AI 的时代,已经不再是什么新鲜事了!
比如之前分享过的字节旗下的两款 AI 产品,豆包和即梦AI,都有「一句话 P 图」的功能。
最近谷歌 Gemini 2.0 Flash 又放出一系列大招。
不仅可以用多轮对话的方式实现图片编辑,还能「一句话生成一篇图文」。
比如:
- 一句话生成图文并茂的菜谱制作教程
- 一句话生成故事绘本,且能保持绘本角色和场景的一致性
- 一句话生成趣味教学图文
- ...
一起来看看效果和如何使用~
一、Gemini 2.0 Flash 入口
打开 Google AI Studio:
aistudio.google.com/prompts/new...
使用非常简单,两步:
① 模型(Model)选择「Gemini 2.0 Flash Experimental」,输出格式(Output format)选择「Images and text」。
② 在输入框中输入具体需求就可以了。
二、多轮对话式图片编辑
先来看看「一句话 P 图」。
这是之前去阿那亚玩,拍的一张照片。当时的天气不是很好,天灰蒙蒙的。
使用 Gemini,一句话就能把图片变晴天:
P 掉路人
上面的图片中,有很多路人。现在让 Gemini 把路人全部 P 掉。
看效果,P 得还挺干净。
换背景
一句话换背景:
换装
再来看看 Gemini 图像编辑的其他用途,比如换装。
一句话把马斯克的西服,换成汉服,效果也还可以。
去水印
再来看看 Gemini 的去水印效果。
上传了一张平铺的水印,水印遍布图片的上下左右等多个部分,给 Gemini 增加点难度。
输入「去掉图片上的水印"X小鹿"」,发现 Gemini 把所有水印都去掉了。
添加元素
风格转换
给线稿上色
图片融合
也可以用 Gemini 做产品宣传图,比如将产品主图和背景图融合在一起:
上面就是测试的 Gemini 图片编辑的 8 个常用场景。
如果对 Gemini 输出的效果不满意,还可以继续和 Gemini 进行多轮对话来修改图片。
三、文本、图像一起输出
接下来再来看看 Gemini 2.0 Flash 的「一句话出一篇图文」的效果。
快速出菜品制作教程
提示词:请给出清蒸鲈鱼的详细制作步骤,并且每一步都需要有图片说明
输入提示词后,Gemini 就开始框框输出了,而且每一步中,都自动配了对应的图片。
这效果简直超出预期!
只用了几十秒,一份菜品的制作教程就制作完成了,这个功能简直强了!
会做清蒸鲈鱼的小伙伴,可以看看 AI 出的这份教程怎么样
快速制作绘本
Gemini 2.0 Flash 还非常适合做绘本,而且还能保持角色和场景的一致性。
提示词:生成一个关于小狗多年守在原地等待主人回家的故事,故事有6个部分,采用 2D 卡通动画风格。每一个场景,生成一张图片
四、更多特性
Gemini 2.0 Flash 利用「世界知识」和「增强推理」来生成正确的图像。
除了上面介绍的这些功能,Gemini 2.0 Flash 在长文本渲染方面表现也不错。
不过目前来看,中文表现得还不是很好。
五、总结
最后来总结一下~
在去年 12 月,谷歌首次在 Gemini 2.0 Flash 中引入了原生图像输出,而现在,终于可以在 Google AI Studio 中使用了。
在 Google AI Studio 中,模型选择「Gemini 2.0 Flash Experimental」,输出格式选择「Images and text」,输入需求,就可以体验了。
除了可以使用 Google AI Studio,也可以通过 Gemini API 来体验 Gemini 2.0 Flash。
上面介绍了 Gemini 2.0 Flash 图片编辑的 8 种常见场景:
P 掉路人、换背景、换装、去水印、添加元素、风格转换、给线稿上色、图片融合,
以及 2 种一键出图文的场景:
菜品制作教程、绘本制作。
更多的场景,留给大家来探索啦。
目前「完全免费」,感兴趣的快去试试吧~
更多 AI 工具,见【AI工具】专栏。