Google发布图像生成新工具Whisk:无需复杂提示词,使用图像和人工智能将想法可视化并重新混合

Whisk 是 Google Labs 的一项新实验,可使用图像进行快速而有趣的创作过程。Whisk不会生成带有长篇详细文本提示的图像,而是使用图像进行提示。只需拖入图像,即可开始创建。

whisk总结如下:

  • Whisk 是 Google 实验室最新的生成图像实验,专注于快速视觉构思,而无需深入理解提示!

  • 只需添加几张图像作为方向参考(场景、主题、风格),Whisk 就会推荐一些图像供您继续完善。

  • Whisk 由 Google 的 Gemini(具有视觉理解功能的语言模型)和 Imagen 3(生成图像模型)协同工作提供支持。

  • 将图画变成毛绒玩具?制作史诗般的节日贺卡?制作漂亮的心情板?或者故事的开头......

生成示例

在后台,Gemini 模型会自动为您的图片编写详细的说明。然后,它会将这些说明输入到 Google 最新的图片生成模型Imagen 3中。此过程会捕捉主题的本质,而不是一模一样的复制品。可以轻松地以新颖的方式重新组合主题、场景和风格。

如何使用?

使用说明

  1. 可以上传3 张图片,随后「Whisk」就会生成出符合你的条件的AI 图片。如果你觉得生成出来的AI 图片不符合你的期待,则是可以输入文字作为补充,让「Whisk」重新生成出符合所有条件的AI 图片。
  1. 进入「Whisk」网页后,点击左下角的「+号」,即可开始生成AI 图片。

3.可以新增3 张图片,让「Whisk」依照你的风格、样式,生成适合的AI 图片。

  1. 生成好的AI 图片可以透过文字再进行编辑,也可以直接下载。
相关推荐
hans汉斯28 分钟前
计算机科学与应用|基于大模型深度语义理解的智能内容纠错系统
人工智能·计算机视觉·视觉检测·数据·病虫害检测
Mr数据杨37 分钟前
【CanMV K210】视觉识别 颜色阈值分割与色块检测实验
人工智能·硬件开发·canmv k210
Bruce_Liuxiaowei40 分钟前
OpenClaw 网关启动失败:配置文件权限错误的排查与修复
人工智能·智能体
kobesdu1 小时前
【ROS2实战笔记-18】ROS2 通信的隐秘控制:DDS 配置参数如何决定系统性能
网络·人工智能·笔记·机器人·开源·ros·人形机器人
组合缺一1 小时前
Java AI 框架三国杀:Solon AI vs Spring AI vs LangChain4j 深度对比
java·人工智能·spring·ai·langchain·llm·solon
碳基硅坊1 小时前
GPT-5.5 vs Claude Opus 4.7:两大顶级模型的深度横评
人工智能·claude opus 4.7·gpt 5.5
eastyuxiao1 小时前
第二章 数字孪生核心技术体系
大数据·人工智能·数字孪生
xwz小王子1 小时前
刚刚,诺奖得主David Baker团队Nature发文:AI正从“造分子”迈向“造机器”
人工智能
humcomm1 小时前
边缘计算如何与云原生技术结合
人工智能·云原生·边缘计算
扬帆破浪2 小时前
免费开源AI软件.桌面单机版,可移动的AI知识库,察元 AI桌面版:macOS首次启动报无法验证 开发者签名与公证的现实做法
人工智能·macos·开源·知识图谱