谷歌发布 Project Genie:基于文本生成可互动 3D 虚拟世界

谷歌DeepMind发布实验性AI工具Project Genie,用户通过自然语言描述就能即时创建并探索逼真的三维虚拟环境

Project Genie基于Genie 3世界模型,支持实时生成动态世界,每秒渲染24帧,分辨率达1280x720。用户输入环境提示词和角色描述后,系统先生成草图预览,再转为可导航的完整场景。用户可在其中自由移动、调整视角和渲染风格,互动时长目前上限为60秒,并可保存过程为视频

Project Genie整合Nano Banana Pro图像模型,将简单草图转为高质量3D物体。相比传统静态生成工具,它实现实时路径预测和世界一致性,适用于创意探索、AI训练数据生成等领域。目前仅限美国Google AI Ultra订阅用户(每月250美元)使用,未来计划扩展至更多国家和开发者API

参考:

https://blog.google/innovation-and-ai/models-and-research/google-deepmind/project-genie/

相关推荐
balmtv3 分钟前
GPT-5.4镜像实测:gpt技术拆解——当AI学会操控电脑
人工智能·gpt·电脑
大傻^3 分钟前
Spring AI 2.0 生产部署指南:从 1.x 迁移、性能调优与云原生实践
人工智能·spring·云原生·springai
不懒不懒3 分钟前
【机器学习模型评估:8种算法对比实战(本篇文章先介绍6种)】
人工智能·机器学习
ejjdhdjdjdjdjjsl4 分钟前
halcon算子
人工智能·算法·计算机视觉
JEECG低代码平台4 分钟前
JeecgBoot低代码 AI工作流变量聚合节点:多路数据择优合并与智能兜底方案
人工智能·低代码
2501_933329556 分钟前
万字拆解Infoseek舆情监测系统:基于大模型+多模态的分布式舆情中台架构实践
人工智能·分布式·架构·媒体
大傻^6 分钟前
SpringAI2.0 RAG 完整实现:Document ETL、Vector Store 与检索增强
人工智能·检索增强·rag·springai
人工智能AI技术7 分钟前
C# Runner + OpenClaw双实战:用.NET写原生AI Agent,告别Python依赖
人工智能·c#
sin°θ_陈8 分钟前
CVPR 2026的3DGS卷到什么地步?工程语义上探:BrepGaussian如何打通图像到CAD的最后一公里?(Part II 7-8)
3d