Google发布图像生成新工具Whisk:无需复杂提示词,使用图像和人工智能将想法可视化并重新混合

Whisk 是 Google Labs 的一项新实验,可使用图像进行快速而有趣的创作过程。Whisk不会生成带有长篇详细文本提示的图像,而是使用图像进行提示。只需拖入图像,即可开始创建。

whisk总结如下:

  • Whisk 是 Google 实验室最新的生成图像实验,专注于快速视觉构思,而无需深入理解提示!

  • 只需添加几张图像作为方向参考(场景、主题、风格),Whisk 就会推荐一些图像供您继续完善。

  • Whisk 由 Google 的 Gemini(具有视觉理解功能的语言模型)和 Imagen 3(生成图像模型)协同工作提供支持。

  • 将图画变成毛绒玩具?制作史诗般的节日贺卡?制作漂亮的心情板?或者故事的开头......

生成示例

在后台,Gemini 模型会自动为您的图片编写详细的说明。然后,它会将这些说明输入到 Google 最新的图片生成模型Imagen 3中。此过程会捕捉主题的本质,而不是一模一样的复制品。可以轻松地以新颖的方式重新组合主题、场景和风格。

如何使用?

使用说明

  1. 可以上传3 张图片,随后「Whisk」就会生成出符合你的条件的AI 图片。如果你觉得生成出来的AI 图片不符合你的期待,则是可以输入文字作为补充,让「Whisk」重新生成出符合所有条件的AI 图片。
  1. 进入「Whisk」网页后,点击左下角的「+号」,即可开始生成AI 图片。

3.可以新增3 张图片,让「Whisk」依照你的风格、样式,生成适合的AI 图片。

  1. 生成好的AI 图片可以透过文字再进行编辑,也可以直接下载。
相关推荐
YMWM_几秒前
jetson thor上的显存
人工智能·jetson thor
wzl20261213几秒前
基于企微API与数据中台,构建用户分层与沉默用户召回体系
大数据·人工智能·企业微信
LY智网强哥2 分钟前
GEO和SEO有什么区别?先做谁、怎么配合、各看什么指标
人工智能·产品运营
咚咚王者5 分钟前
人工智能之语言领域 自然语言处理 第二十一章 综合实战项目
人工智能·自然语言处理
张张123y7 分钟前
AI大模型应用面试:深度学习知识点汇总与面试指导
人工智能·深度学习·面试
rosmis8 分钟前
复杂工程拆解:自顶向下设计,自底向上实现
人工智能·python·机器人·自动化·自动驾驶·硬件工程·制造
hughnz13 分钟前
斯伦贝谢成功的创新策略
人工智能·能源·钻井
m0_6125919715 分钟前
尚航科技 IDC 服务综合实力对比分析
人工智能·科技
柯儿的天空17 分钟前
2026年AI技术突破与产业落地全景:从GPT-5到多模态智能体的新纪元
人工智能·gpt·microsoft·开源·aigc·ai编程·ai写作
人工智能AI技术18 分钟前
GitHub Trending榜首:Python Agentic RAG企业级落地指南
人工智能·python