谷歌Gemini杀疯了!1句话自动生一篇图文、1句话P图,10大场景,1分钟速览!(附提示词)

一句话 P 图,在 AI 的时代,已经不再是什么新鲜事了!

比如之前分享过的字节旗下的两款 AI 产品,豆包和即梦AI,都有「一句话 P 图」的功能。

最近谷歌 Gemini 2.0 Flash 又放出一系列大招。

不仅可以用多轮对话的方式实现图片编辑,还能「一句话生成一篇图文」。

比如:

  • 一句话生成图文并茂的菜谱制作教程
  • 一句话生成故事绘本,且能保持绘本角色和场景的一致性
  • 一句话生成趣味教学图文
  • ...

一起来看看效果和如何使用~

一、Gemini 2.0 Flash 入口

打开 Google AI Studio:

aistudio.google.com/prompts/new...

使用非常简单,两步:

① 模型(Model)选择「Gemini 2.0 Flash Experimental」,输出格式(Output format)选择「Images and text」。

② 在输入框中输入具体需求就可以了。

二、多轮对话式图片编辑

先来看看「一句话 P 图」。

这是之前去阿那亚玩,拍的一张照片。当时的天气不是很好,天灰蒙蒙的。

使用 Gemini,一句话就能把图片变晴天:

P 掉路人

上面的图片中,有很多路人。现在让 Gemini 把路人全部 P 掉。

看效果,P 得还挺干净。

换背景

一句话换背景:

换装

再来看看 Gemini 图像编辑的其他用途,比如换装。

一句话把马斯克的西服,换成汉服,效果也还可以。

去水印

再来看看 Gemini 的去水印效果。

上传了一张平铺的水印,水印遍布图片的上下左右等多个部分,给 Gemini 增加点难度。

输入「去掉图片上的水印"X小鹿"」,发现 Gemini 把所有水印都去掉了。

添加元素

风格转换

给线稿上色

图片融合

也可以用 Gemini 做产品宣传图,比如将产品主图和背景图融合在一起:

上面就是测试的 Gemini 图片编辑的 8 个常用场景。

如果对 Gemini 输出的效果不满意,还可以继续和 Gemini 进行多轮对话来修改图片。

三、文本、图像一起输出

接下来再来看看 Gemini 2.0 Flash 的「一句话出一篇图文」的效果。

快速出菜品制作教程

提示词:请给出清蒸鲈鱼的详细制作步骤,并且每一步都需要有图片说明

输入提示词后,Gemini 就开始框框输出了,而且每一步中,都自动配了对应的图片。

这效果简直超出预期!

只用了几十秒,一份菜品的制作教程就制作完成了,这个功能简直强了!

会做清蒸鲈鱼的小伙伴,可以看看 AI 出的这份教程怎么样

快速制作绘本

Gemini 2.0 Flash 还非常适合做绘本,而且还能保持角色和场景的一致性。

提示词:生成一个关于小狗多年守在原地等待主人回家的故事,故事有6个部分,采用 2D 卡通动画风格。每一个场景,生成一张图片

四、更多特性

Gemini 2.0 Flash 利用「世界知识」和「增强推理」来生成正确的图像。

除了上面介绍的这些功能,Gemini 2.0 Flash 在长文本渲染方面表现也不错。

不过目前来看,中文表现得还不是很好。

五、总结

最后来总结一下~

在去年 12 月,谷歌首次在 Gemini 2.0 Flash 中引入了原生图像输出,而现在,终于可以在 Google AI Studio 中使用了。

在 Google AI Studio 中,模型选择「Gemini 2.0 Flash Experimental」,输出格式选择「Images and text」,输入需求,就可以体验了。

除了可以使用 Google AI Studio,也可以通过 Gemini API 来体验 Gemini 2.0 Flash。

上面介绍了 Gemini 2.0 Flash 图片编辑的 8 种常见场景:

P 掉路人、换背景、换装、去水印、添加元素、风格转换、给线稿上色、图片融合,

以及 2 种一键出图文的场景:

菜品制作教程、绘本制作。

更多的场景,留给大家来探索啦。

目前「完全免费」,感兴趣的快去试试吧~


更多 AI 工具,见【AI工具】专栏。

相关推荐
三道杠卷胡2 小时前
【AI News | 20250729】每日AI进展
人工智能·python·计算机视觉·语言模型·aigc
奇舞精选3 小时前
长音频离线语音识别系统——基于Whisper.cpp的本地部署方案
aigc
安思派Anspire4 小时前
GraphRAG 工作原理分步解析(一)
aigc·openai·agent
盼小辉丶4 小时前
生成模型实战 | GLOW详解与实现
深度学习·aigc·生成模型
后端小肥肠5 小时前
1 分钟出 10w + 职场漫画!Coze 一键生成,小白也能轻松拿捏
人工智能·aigc·coze
Sherlock Ma7 小时前
字节跳动GR-3:可泛化、支持长序列复杂操作任务的机器人操作大模型(技术报告解读)
人工智能·计算机视觉·语言模型·机器人·大模型·aigc·具身智能
堆栈future19 小时前
深度解析AI Agent:从概念、原理到构建模式,一文彻底搞懂
llm·aigc·agent
爱分享的飘哥19 小时前
第三篇:VAE架构详解与PyTorch实现:从零构建AI的“视觉压缩引擎”
人工智能·pytorch·python·aigc·教程·生成模型·代码实战
墨风如雪20 小时前
OpenAI的“阳谋”:ChatGPT不想再当你枪手了
aigc
iThinkAi1 天前
Coze工作流一键导入,100+扣子智能体工作流,一键复制到自己的空间!
aigc