谷歌发布 Project Genie:基于文本生成可互动 3D 虚拟世界

谷歌DeepMind发布实验性AI工具Project Genie,用户通过自然语言描述就能即时创建并探索逼真的三维虚拟环境

Project Genie基于Genie 3世界模型,支持实时生成动态世界,每秒渲染24帧,分辨率达1280x720。用户输入环境提示词和角色描述后,系统先生成草图预览,再转为可导航的完整场景。用户可在其中自由移动、调整视角和渲染风格,互动时长目前上限为60秒,并可保存过程为视频

Project Genie整合Nano Banana Pro图像模型,将简单草图转为高质量3D物体。相比传统静态生成工具,它实现实时路径预测和世界一致性,适用于创意探索、AI训练数据生成等领域。目前仅限美国Google AI Ultra订阅用户(每月250美元)使用,未来计划扩展至更多国家和开发者API

参考:

https://blog.google/innovation-and-ai/models-and-research/google-deepmind/project-genie/

相关推荐
Promise微笑2 小时前
信任重构与AI采信:深度解析“两大核心+四轮驱动”Geo优化新范式
人工智能·重构
光羽隹衡2 小时前
计算机视觉——Opencv(角点检测和特征提取)
人工智能·opencv·计算机视觉
小饼干超人2 小时前
pytorch返回张量元素总数量的方法 x.numel()
人工智能·pytorch·python
啊巴矲2 小时前
小白从零开始勇闯人工智能:计算机视觉初级篇(OpenCV综合实战(上))
人工智能·opencv·计算机视觉
薛不痒2 小时前
计算机视觉opencv之人脸识别1
人工智能·opencv·计算机视觉
Godspeed Zhao2 小时前
自动驾驶中的传感器技术89——Sensor Fusion(12)
人工智能·机器学习·自动驾驶
Dfreedom.2 小时前
详解四大格式(PIL/OpenCV/NumPy/PyTorch)的转换原理与场景选择
图像处理·人工智能·pytorch·opencv·numpy·pillow
有Li2 小时前
3D CT图像的MedLSAM:定位并分割任何模型/文献速递-基于人工智能的医学影像技术
人工智能·深度学习·计算机视觉
qwy7152292581632 小时前
15-轨迹栏作为调色板
人工智能·opencv·计算机视觉