Google发布图像生成新工具Whisk:无需复杂提示词,使用图像和人工智能将想法可视化并重新混合

Whisk 是 Google Labs 的一项新实验,可使用图像进行快速而有趣的创作过程。Whisk不会生成带有长篇详细文本提示的图像,而是使用图像进行提示。只需拖入图像,即可开始创建。

whisk总结如下:

  • Whisk 是 Google 实验室最新的生成图像实验,专注于快速视觉构思,而无需深入理解提示!

  • 只需添加几张图像作为方向参考(场景、主题、风格),Whisk 就会推荐一些图像供您继续完善。

  • Whisk 由 Google 的 Gemini(具有视觉理解功能的语言模型)和 Imagen 3(生成图像模型)协同工作提供支持。

  • 将图画变成毛绒玩具?制作史诗般的节日贺卡?制作漂亮的心情板?或者故事的开头......

生成示例

在后台,Gemini 模型会自动为您的图片编写详细的说明。然后,它会将这些说明输入到 Google 最新的图片生成模型Imagen 3中。此过程会捕捉主题的本质,而不是一模一样的复制品。可以轻松地以新颖的方式重新组合主题、场景和风格。

如何使用?

使用说明

  1. 可以上传3 张图片,随后「Whisk」就会生成出符合你的条件的AI 图片。如果你觉得生成出来的AI 图片不符合你的期待,则是可以输入文字作为补充,让「Whisk」重新生成出符合所有条件的AI 图片。
  1. 进入「Whisk」网页后,点击左下角的「+号」,即可开始生成AI 图片。

3.可以新增3 张图片,让「Whisk」依照你的风格、样式,生成适合的AI 图片。

  1. 生成好的AI 图片可以透过文字再进行编辑,也可以直接下载。
相关推荐
周杰伦_Jay28 分钟前
continue插件实现IDEA接入本地离线部署的deepseek等大模型
java·数据结构·ide·人工智能·算法·数据挖掘·intellij-idea
海森大数据37 分钟前
Crawl4AI:打破数据孤岛,开启大语言模型的实时智能新时代
人工智能·语言模型·自然语言处理
果冻人工智能43 分钟前
我在大厂做 机器学习工程经理:这六顶帽子,每天都在换
人工智能
萧鼎1 小时前
RAGFlow:构建高效检索增强生成流程的技术解析
人工智能·python
爱的叹息1 小时前
主流开源 LLM 应用开发平台详解
人工智能·开源
赋范大模型技术社区1 小时前
从0手撕代码搭建MCP Client与Server!详解DeepSeek、ollama、vLLM接入MCP实战!
人工智能·mcp
lx7416026981 小时前
配置RSUniVLM环境(自用)
计算机视觉
漫谈网络1 小时前
Ollama工具调用(Tool Calls)业务应用案例
linux·ai·aigc·工具调用·ollama·tool calls
Baihai_IDP1 小时前
面对开源大模型浪潮,基础模型公司如何持续盈利?
人工智能·openai·deepseek
陈明勇2 小时前
MCP 实战:用 Go 语言开发一个查询 IP 信息的 MCP 服务器
人工智能·后端·mcp