谷歌Gemini杀疯了!1句话自动生一篇图文、1句话P图,10大场景,1分钟速览!(附提示词)

一句话 P 图,在 AI 的时代,已经不再是什么新鲜事了!

比如之前分享过的字节旗下的两款 AI 产品,豆包和即梦AI,都有「一句话 P 图」的功能。

最近谷歌 Gemini 2.0 Flash 又放出一系列大招。

不仅可以用多轮对话的方式实现图片编辑,还能「一句话生成一篇图文」。

比如:

  • 一句话生成图文并茂的菜谱制作教程
  • 一句话生成故事绘本,且能保持绘本角色和场景的一致性
  • 一句话生成趣味教学图文
  • ...

一起来看看效果和如何使用~

一、Gemini 2.0 Flash 入口

打开 Google AI Studio:

aistudio.google.com/prompts/new...

使用非常简单,两步:

① 模型(Model)选择「Gemini 2.0 Flash Experimental」,输出格式(Output format)选择「Images and text」。

② 在输入框中输入具体需求就可以了。

二、多轮对话式图片编辑

先来看看「一句话 P 图」。

这是之前去阿那亚玩,拍的一张照片。当时的天气不是很好,天灰蒙蒙的。

使用 Gemini,一句话就能把图片变晴天:

P 掉路人

上面的图片中,有很多路人。现在让 Gemini 把路人全部 P 掉。

看效果,P 得还挺干净。

换背景

一句话换背景:

换装

再来看看 Gemini 图像编辑的其他用途,比如换装。

一句话把马斯克的西服,换成汉服,效果也还可以。

去水印

再来看看 Gemini 的去水印效果。

上传了一张平铺的水印,水印遍布图片的上下左右等多个部分,给 Gemini 增加点难度。

输入「去掉图片上的水印"X小鹿"」,发现 Gemini 把所有水印都去掉了。

添加元素

风格转换

给线稿上色

图片融合

也可以用 Gemini 做产品宣传图,比如将产品主图和背景图融合在一起:

上面就是测试的 Gemini 图片编辑的 8 个常用场景。

如果对 Gemini 输出的效果不满意,还可以继续和 Gemini 进行多轮对话来修改图片。

三、文本、图像一起输出

接下来再来看看 Gemini 2.0 Flash 的「一句话出一篇图文」的效果。

快速出菜品制作教程

提示词:请给出清蒸鲈鱼的详细制作步骤,并且每一步都需要有图片说明

输入提示词后,Gemini 就开始框框输出了,而且每一步中,都自动配了对应的图片。

这效果简直超出预期!

只用了几十秒,一份菜品的制作教程就制作完成了,这个功能简直强了!

会做清蒸鲈鱼的小伙伴,可以看看 AI 出的这份教程怎么样

快速制作绘本

Gemini 2.0 Flash 还非常适合做绘本,而且还能保持角色和场景的一致性。

提示词:生成一个关于小狗多年守在原地等待主人回家的故事,故事有6个部分,采用 2D 卡通动画风格。每一个场景,生成一张图片

四、更多特性

Gemini 2.0 Flash 利用「世界知识」和「增强推理」来生成正确的图像。

除了上面介绍的这些功能,Gemini 2.0 Flash 在长文本渲染方面表现也不错。

不过目前来看,中文表现得还不是很好。

五、总结

最后来总结一下~

在去年 12 月,谷歌首次在 Gemini 2.0 Flash 中引入了原生图像输出,而现在,终于可以在 Google AI Studio 中使用了。

在 Google AI Studio 中,模型选择「Gemini 2.0 Flash Experimental」,输出格式选择「Images and text」,输入需求,就可以体验了。

除了可以使用 Google AI Studio,也可以通过 Gemini API 来体验 Gemini 2.0 Flash。

上面介绍了 Gemini 2.0 Flash 图片编辑的 8 种常见场景:

P 掉路人、换背景、换装、去水印、添加元素、风格转换、给线稿上色、图片融合,

以及 2 种一键出图文的场景:

菜品制作教程、绘本制作。

更多的场景,留给大家来探索啦。

目前「完全免费」,感兴趣的快去试试吧~


更多 AI 工具,见【AI工具】专栏。

相关推荐
橙序员小站7 小时前
Harness Engineering:从 OpenClaw 看 AI 助理的基础设施建设
后端·aigc·openai
GISer_Jing9 小时前
AI Agent操作系统架构师:Harness Engineer解析
前端·人工智能·ai·aigc
陆业聪14 小时前
AI 时代最被低估的工程师技能:把需求写清楚
android·人工智能·aigc
GISer_Jing14 小时前
Claude Code架构深度解析:从核心文件到Harness的确定性控制体系
ai·架构·aigc
墨风如雪15 小时前
Obsidian 写作环境搭建:这 6 款插件让我的博客管理效率翻倍
aigc
AI袋鼠帝15 小时前
终于找到免费的本地Agent了!量大管饱,真干活~
人工智能·aigc
陆业聪16 小时前
从推理到行动:Agent 范式的真正跃迁正在发生
人工智能·aigc
万里鹏程转瞬至16 小时前
为什么早期线性注意力没有成为主流大模型方案?
深度学习·aigc
ryrhhhh17 小时前
低延迟高精准:陌讯AIGC检测如何破解AI内容审核效率难题
人工智能·aigc