谷歌发布 Project Genie:基于文本生成可互动 3D 虚拟世界

谷歌DeepMind发布实验性AI工具Project Genie,用户通过自然语言描述就能即时创建并探索逼真的三维虚拟环境

Project Genie基于Genie 3世界模型,支持实时生成动态世界,每秒渲染24帧,分辨率达1280x720。用户输入环境提示词和角色描述后,系统先生成草图预览,再转为可导航的完整场景。用户可在其中自由移动、调整视角和渲染风格,互动时长目前上限为60秒,并可保存过程为视频

Project Genie整合Nano Banana Pro图像模型,将简单草图转为高质量3D物体。相比传统静态生成工具,它实现实时路径预测和世界一致性,适用于创意探索、AI训练数据生成等领域。目前仅限美国Google AI Ultra订阅用户(每月250美元)使用,未来计划扩展至更多国家和开发者API

参考:

https://blog.google/innovation-and-ai/models-and-research/google-deepmind/project-genie/

相关推荐
大龄程序员狗哥1 小时前
第47篇:使用Speech-to-Text API快速构建语音应用(操作教程)
人工智能
KKKlucifer1 小时前
数据安全合规自动化:策略落地、审计追溯与风险闭环技术解析
人工智能·安全
RWKV元始智能1 小时前
RWKV超并发项目教程,RWKV-LM训练提速40%
人工智能·rnn·深度学习·自然语言处理·开源
dyj0951 小时前
Dify - (一)、本地部署Dify+聊天助手/Agent
人工智能·docker·容器
墨染天姬1 小时前
【AI】Hermes的GEPA算法
人工智能·算法
小超同学你好1 小时前
OpenClaw 深度解析系列 · 第8篇:Learning & Adaptation(学习与自适应)
人工智能·语言模型·chatgpt
紫微AI1 小时前
前端文本测量成了卡死一切创新的最后瓶颈,pretext实现突破了
前端·人工智能·typescript
码途漫谈2 小时前
Easy-Vibe开发篇阅读笔记(四)——前端开发之结合 Agent Skills 美化界面
人工智能·笔记·ai·开源·ai编程
易连EDI—EasyLink2 小时前
易连EDI–EasyLink实现OCR智能数据采集
网络·人工智能·安全·汽车·ocr·edi
冬奇Lab2 小时前
RAG 系列(二):用 LangChain 搭建你的第一个 RAG Pipeline
人工智能·langchain·llm