谷歌发布 Project Genie:基于文本生成可互动 3D 虚拟世界

谷歌DeepMind发布实验性AI工具Project Genie,用户通过自然语言描述就能即时创建并探索逼真的三维虚拟环境

Project Genie基于Genie 3世界模型,支持实时生成动态世界,每秒渲染24帧,分辨率达1280x720。用户输入环境提示词和角色描述后,系统先生成草图预览,再转为可导航的完整场景。用户可在其中自由移动、调整视角和渲染风格,互动时长目前上限为60秒,并可保存过程为视频

Project Genie整合Nano Banana Pro图像模型,将简单草图转为高质量3D物体。相比传统静态生成工具,它实现实时路径预测和世界一致性,适用于创意探索、AI训练数据生成等领域。目前仅限美国Google AI Ultra订阅用户(每月250美元)使用,未来计划扩展至更多国家和开发者API

参考:

https://blog.google/innovation-and-ai/models-and-research/google-deepmind/project-genie/

相关推荐
宸津-代码粉碎机5 分钟前
Spring Boot 4.0虚拟线程实战调优技巧,最大化发挥并发优势
java·人工智能·spring boot·后端·python
老兵发新帖14 分钟前
Hermes:比openclaw更好用的智能体?
人工智能
俊哥V22 分钟前
每日 AI 研究简报 · 2026-04-09
人工智能·ai
答案—answer22 分钟前
ThreeFlowX接入3D体积云和谷歌3D瓦片地图
3d
MicrosoftReactor23 分钟前
技术速递|使用 Copilot SDK 构建 AI 驱动的 GitHub Issue 分类系统
人工智能·github·copilot
七77.24 分钟前
【世界模型】FLASHWORLD: HIGH-QUALITY 3D SCENE GENERATION WITHIN SECONDS
3d·世界模型
AI成长日志25 分钟前
【GitHub开源项目专栏】AI推理优化框架深度解析(上):vLLM架构设计与核心实现
人工智能·开源·github
数智前线26 分钟前
三次“进窄门”,MiniMax走向AGI深处
人工智能
AI视觉网奇27 分钟前
几何数据集 多模态
人工智能·深度学习
Figo_Cheung27 分钟前
Figo义商本体约束推理引擎 (CRE):基于已部署CRE本地模型的技术实践研究——迈向AGI时代的AI伦理安全框架
人工智能·安全