谷歌Gemini杀疯了!1句话自动生一篇图文、1句话P图,10大场景,1分钟速览!(附提示词)

一句话 P 图,在 AI 的时代,已经不再是什么新鲜事了!

比如之前分享过的字节旗下的两款 AI 产品,豆包和即梦AI,都有「一句话 P 图」的功能。

最近谷歌 Gemini 2.0 Flash 又放出一系列大招。

不仅可以用多轮对话的方式实现图片编辑,还能「一句话生成一篇图文」。

比如:

  • 一句话生成图文并茂的菜谱制作教程
  • 一句话生成故事绘本,且能保持绘本角色和场景的一致性
  • 一句话生成趣味教学图文
  • ...

一起来看看效果和如何使用~

一、Gemini 2.0 Flash 入口

打开 Google AI Studio:

aistudio.google.com/prompts/new...

使用非常简单,两步:

① 模型(Model)选择「Gemini 2.0 Flash Experimental」,输出格式(Output format)选择「Images and text」。

② 在输入框中输入具体需求就可以了。

二、多轮对话式图片编辑

先来看看「一句话 P 图」。

这是之前去阿那亚玩,拍的一张照片。当时的天气不是很好,天灰蒙蒙的。

使用 Gemini,一句话就能把图片变晴天:

P 掉路人

上面的图片中,有很多路人。现在让 Gemini 把路人全部 P 掉。

看效果,P 得还挺干净。

换背景

一句话换背景:

换装

再来看看 Gemini 图像编辑的其他用途,比如换装。

一句话把马斯克的西服,换成汉服,效果也还可以。

去水印

再来看看 Gemini 的去水印效果。

上传了一张平铺的水印,水印遍布图片的上下左右等多个部分,给 Gemini 增加点难度。

输入「去掉图片上的水印"X小鹿"」,发现 Gemini 把所有水印都去掉了。

添加元素

风格转换

给线稿上色

图片融合

也可以用 Gemini 做产品宣传图,比如将产品主图和背景图融合在一起:

上面就是测试的 Gemini 图片编辑的 8 个常用场景。

如果对 Gemini 输出的效果不满意,还可以继续和 Gemini 进行多轮对话来修改图片。

三、文本、图像一起输出

接下来再来看看 Gemini 2.0 Flash 的「一句话出一篇图文」的效果。

快速出菜品制作教程

提示词:请给出清蒸鲈鱼的详细制作步骤,并且每一步都需要有图片说明

输入提示词后,Gemini 就开始框框输出了,而且每一步中,都自动配了对应的图片。

这效果简直超出预期!

只用了几十秒,一份菜品的制作教程就制作完成了,这个功能简直强了!

会做清蒸鲈鱼的小伙伴,可以看看 AI 出的这份教程怎么样

快速制作绘本

Gemini 2.0 Flash 还非常适合做绘本,而且还能保持角色和场景的一致性。

提示词:生成一个关于小狗多年守在原地等待主人回家的故事,故事有6个部分,采用 2D 卡通动画风格。每一个场景,生成一张图片

四、更多特性

Gemini 2.0 Flash 利用「世界知识」和「增强推理」来生成正确的图像。

除了上面介绍的这些功能,Gemini 2.0 Flash 在长文本渲染方面表现也不错。

不过目前来看,中文表现得还不是很好。

五、总结

最后来总结一下~

在去年 12 月,谷歌首次在 Gemini 2.0 Flash 中引入了原生图像输出,而现在,终于可以在 Google AI Studio 中使用了。

在 Google AI Studio 中,模型选择「Gemini 2.0 Flash Experimental」,输出格式选择「Images and text」,输入需求,就可以体验了。

除了可以使用 Google AI Studio,也可以通过 Gemini API 来体验 Gemini 2.0 Flash。

上面介绍了 Gemini 2.0 Flash 图片编辑的 8 种常见场景:

P 掉路人、换背景、换装、去水印、添加元素、风格转换、给线稿上色、图片融合,

以及 2 种一键出图文的场景:

菜品制作教程、绘本制作。

更多的场景,留给大家来探索啦。

目前「完全免费」,感兴趣的快去试试吧~


更多 AI 工具,见【AI工具】专栏。

相关推荐
倔强的石头_2 小时前
Dify 接入蓝耘 MaaS:从 0 搭建一个企业知识库问答助手
aigc
程序员佳佳4 小时前
连续使用三个月向量 API 中转站,它真的适配向量落地场景吗?
人工智能·gpt·aigc·ai编程·agi
后端小肥肠6 小时前
小红书篇篇 5 位数阅读!我自研了一套全栈爆款笔记 Skills
人工智能·aigc·agent
鲲鹏AI探索局6 小时前
飞书 CLI 实测:让 Codex 接入真实办公流程
人工智能·aigc·飞书cli
ServBay7 小时前
Qwen3.7-Max 发布,全能智能体基座
后端·aigc·ai编程
米猴设计师9 小时前
Nano Banana AI模特换装教程|PS一键无缝穿搭切换
图像处理·人工智能·aigc·ps插件·nano banana·startai插件
todoitbo11 小时前
TimechoAI 上手:从一段时序数据跑到预测分析
人工智能·ai·aigc·timechoai
92year12 小时前
Headroom 实测:给 AI Agent 的上下文做压缩,Token 省了 90%
aigc
西安老张(AIGC&ComfyUI)12 小时前
第004章:ComfyUI&AIGC基础概念及发展历程(二)
aigc