ChatGPT+Roblox,元宇宙的AI叙事逻辑#Leveling Up

MixCopilot

嗨,亲爱的听众朋友们!欢迎收听我们的播客节目!我是你们的主播:MixCopilot 混合副驾。今天我们要为大家带来的是我们的AI革命系列节目之一。这个系列节目聚焦于AI领域的一些最有影响力的建设者,他们将会讨论和辩论AI的现状、未来以及其中的一些重大问题。如果你想了解更多关于我们AI革命系列的内容,可以回顾往期👆

在本期节目中,我们有幸邀请到了Roblox的联合创始人兼CEO David Baszucki和a16z的Jonathan Lai。他们将会讨论AI如何改变游戏和虚拟世界以及我们如何创造它们。

这可是个非常令人兴奋的话题啊!

不知道你们有尝试过使用 ChatGPT 编写 Roblox 游戏吗?

ChatGPT 让您只需与其聊天即可轻松创建自定义游戏内容。您可以使用它来构建关卡、创建角色、设计游戏机制等等。借助 ChatGPT,Roblox 开发变得简单了 1000 倍。

AI在游戏和虚拟世界中的应用,真是让人大开眼界啊!

所以,亲爱的听众朋友们,准备好了吗?

让我们一起来听听精彩分享吧!

在游戏中应用生成式人工智能

接下来分享一些关于Roblox游戏平台上人工智能如何改变游戏开发方式的见解。

Dave告诉我们,Roblox不仅仅是一个游戏平台,更是一种远程沟通的最终形式。

特别是在疫情期间,很多孩子们无法和朋友们一起玩耍,Roblox提供了一个平台让他们在游戏中与朋友们保持联系。甚至在Roblox的办公室里,他们也模拟了一种偶然性的体验,让远程工作的员工们能够更好地互动。

Dave还提到了人们在Roblox平台上的三个主要应用类别。

第一个是个性化发现,安全和文明的质量,语音和文本监控以及实时自然翻译的质量。

大家可能都没注意到,但这些功能已经在平台上运行了2到4年了。

第二个是生成式模型的应用,包括代码生成、3D物体生成、角色生成和游戏生成。

这些都非常有趣!

最后一个则是未来的方向,也就是虚拟环境中的虚拟副本或者一种智能代理的形式。

你想象一下,在你孩子的学校项目中,你可以让乔治·华盛顿亲自出演?

又或者,如果Roblox与Tinder合作,你是否愿意让你的虚拟副本在首次3D见面时代替你去?

这些想法真是令人兴奋啊!Jon提到了游戏制作中所涉及的各个环节,包括概念设计、故事板、2D和3D图像的创作,还有代码和物理引擎。

而Roblox已经在他们的工作室和平台中构建了许多这些环节。

那么,根据刚才Dave所说的生成式模型的新一代技术,你们可能会好奇这些环节中哪些会受到最大的影响呢?Dave认为几乎所有环节都会受到影响,但他们对此持乐观态度。

在Roblox上有超过6500万的用户,但大多数人并没有达到他们想要的创作水平。

Dave提到了一个有趣的例子,他们曾经设想在Roblox上创建一个仿真的Project Runway,但发现对于大多数人来说,这也太复杂了。现在,当Project Runway在Roblox上出现时,你可以通过文本提示、图像提示、语音提示等方式来参与创作,就像你真的在现场一样。

Dave相信,这种生成式模型技术将加速游戏内容的创作过程。

个性化游戏体验

我们的主讲人Jon提到了一个很有意思的观点,就是人们可以在游戏中创造出自己的个性化体验。

即使在游戏中,他们也能拥有一个完全个性化的角色或外观装扮。这真是太酷了!

Dave接着解释说,传统的3D创作通常使用一些复杂的软件,比如Blender、3D Studio或Maya。而Roblox Studio则提供了更简单易用的创作工具,让更多人可以参与到创作中来。而且,随着AI技术的发展,未来我们还可以看到更高级的个性化体验。

他举了一个例子,比如在Roblox上的"Tycoon Builder"和"Roller Coaster Builder"等游戏中,玩家可以更直观地创建自己的3D物体,并且这些物体还可以在游戏中保持持久化。

而当AI服务能够在任何游戏体验中提供支持时,我们可以想象,比如在"Project Runway"这样的游戏中,玩家可以创造出真正独一无二的时尚体验,而不再局限于传统的3D软件。

Jon进一步提到了个性化游戏体验的强大潜力,即未来的Roblox用户可以享受到完全独特、根据自己偏好和选择量身定制的游戏体验。这真是让人兴奋不已!Dave补充说,这甚至可以进一步扩展,通过实时生成和大规模推理,实现完全个性化的游戏体验。

想象一下,你在玩一款超级龙与地下城的游戏,但是它会根据你的玩法和历史记录,实时生成一个独一无二的3D体验,这是之前没有人见过的!当然,这需要大量的计算能力和推理能力的支持。

我们团队在建设自己的基础设施方面一直做得很好,拥有成千上万台服务器、多个边缘数据中心和大量的网络连接。

这些基础设施主要用于3D模拟,但随着技术的发展,我们也可以将其用于高效的推理任务,以低成本提供高质量的推理服务,让创作者们无需担心成本问题。

哇,听起来真是令人兴奋!

未来的游戏体验将更加个性化、独特而又充满创意。

我们可以期待在Roblox这样的平台上,创造出属于自己的游戏世界,享受到前所未有的个性化乐趣。

Roblox

在最新的股东信中,Roblox提到他们正在开发自己的多模态生成模型,这个模型将包含许多我们刚刚聊到的内容。那么,到底Roblox正在构建什么呢?根据Dave的解释,Roblox是一个非常个性化的公司,有着20到30个面向最终用户的垂直应用程序。自然语言过滤与生成式3D完全不同。但是,在最终用户层面,我们希望所有这些应用都能运行,并且以自愿参与的方式使用所有的数据来帮助提升它们的质量。

在公司内部,可能会有2到3个大型模型的聚类。其中一个与安全和文明、自然语言处理、自然语言翻译有关,另一个与3D创作有关。

就像在《Project Runway》中一样,这些模型可能会结合文本、图像和生成的头像。还有一个领域是虚拟人类,我们如何利用50亿小时的人类自愿参与数据来更好地模拟人类在3D环境中的行为?

我认为在这三个领域中,大型模型的应用是有可能的。

然后,还会有像LLM这样的超大型公司。而我们可能处于这个层级的下一层,非常专注于我们想要的领域,并具备训练和运行这些领域的大规模推断的能力。另外,Roblox有一个庞大的专有数据集供他们使用。所有这些年来在Roblox中创建的3D资源都是宝贵的数据。

在任何3D沉浸式环境中,人们之间的交流可以为安全性、文明性、3D、动作眼球追踪以及人类互动提供有价值的信息。

我们目前正在关注一个非常困难的问题,那就是如何实现真正高质量的3D生成,而不仅仅是2D生成。

虽然市面上有很多出色的2D生成技术,但我们将更加专注于3D生成。在构建技术栈的过程中,Roblox会考虑与外部合作伙伴合作,还是自己内部建设。

毕竟,他们拥有丰富的数据和计算资源。Dave提到,他们对于那些可以以低成本大规模训练和推断的技术非常感兴趣,以及那些可以抽象不同硬件设备的技术。他们会密切关注这些技术栈的发展。

未来的界面设计

你们知道吗,随着我们朝着元宇宙的方向发展,是否需要新的用户界面或发现机制呢?这是我们要探讨的问题。Dave认为,像亚马逊、Netflix、TikTok和YouTube这样的平台,他们面临的难题在于如何在短期内提高企业价值和股价的同时,又能优化长期价值。他们要解决的就是发现问题,因为有时候一些惊人的作品可能会被埋没,本可以为平台增加5%的价值。

发现问题确实是一个挑战,虽然很多公司正在以非常有趣的方式来解决。不仅仅是内容和实时社交网络,用户界面也有很多改变的机会。我们可以思考其他人在做什么,从而找到更多的机会。

Jon觉得这很有趣,因为我们刚刚提到了Netflix和TikTok等大公司使用人工智能的例子,它们都有个性化的推荐和动态供应。

你可以想象一下未来的情景,当一个用户进入Roblox时,可能不再看到游戏库或游戏目录,而是直接展示一个动态供应,你就像是从一个端到另一个端穿梭一样。Dave表示,这个想法很准确。我们正在不断测试新的用户体验。

应该是2D还是3D界面呢?

数字身份的创建和发现之间的权重是多少?

与朋友们的互动和优化又如何权衡?

或许我们会发现,这些都需要个性化来实现。哇,听起来未来的界面设计真是令人兴奋啊!我们可以期待在元宇宙中体验到更多个性化和创新的界面呢!

AI技术对创作者的影响

我们刚刚听到了Jon和Dave的对话,他们谈论了AI工具对创作者和玩家的影响以及反馈。根据Dave的说法,当我们给用户或玩家提供更多的功能时,通常会看到事情的加速发展,尽管现在还只是初期阶段。他提到了一些已经推出的AI工具,比如代码辅助和材质生成器,还有一些即将推出的功能,比如基于提示的角色创建和通用3D资产创建。

这些功能都非常令人兴奋,能够给创作者和玩家带来更多的可能性。Jon接着问道,这些技术是否会改变游戏的玩法机制,是否会出现新的游戏类型?

Dave表示乐观地认为,越来越多的人将能够在创作中拥有更多的控制权。

他举了一个例子,就像是《Project Runway》或Karlie Kloss的经验,这样的创作体验在过去是不可能的。但是,如果有数以百万计的人可以充当时装设计师,并参与投票和选择最优秀的作品,那么一些作品甚至可能被制作成真实的物品,或者被学院挑选出成为未来的设计师。

我们可以想象,通过AI工具来增强孩子们的创造力,从他们的想象力和玩耍中获得更多的灵感。比如,如果在房间中发生了自然灾害,创作者们很难制作出这样的体验。但是通过一个文本提示,你可以想象到有一些游戏会在瞬间生成,这些体验的多样性和狂野程度将是令人难以置信的。

Dave进一步提到,我们不仅可以在开发大型游戏时使用AI工具,而且可以在任何地方自然地使用文本提示或语音提示。这将取代传统的使用体素或在3D环境中建模的方式,就像在传统的角色编辑器中使用滑块和单选按钮一样,我们可以更交互式地使用文本提示来进行创作。

AI技术的发展将给创作者和玩家带来更多的可能性和创作空间。让我们拭目以待,看看未来会有怎样的创作和游戏新体验吧!

NPC作为副驾驶员的概念

NPC作为教师和副驾驶员这个想法感到非常兴奋。他们认为,在你第一次使用Roblox时,可以有一个向导NPC,告诉你接下来应该去哪里。如果你对建设方面感兴趣,它还可以帮助你组织你的前几个体验,等等。

这种将NPC作为副驾驶员而不是合作玩家的概念,潜力巨大!Dave提到了一些关于副驾驶员的有趣事情。有一种副驾驶员是我们整天戴着耳机,它会一直和我们对话。这可能更多地是面向消费者的实时副驾驶员。但显然有很多公司正在努力构建一种副驾驶员,它可以连接到你的电子邮件、短信、Slack、网络浏览器等,代替你进行一些操作。

我对副驾驶员之间使用自然英语进行对话的概念非常感兴趣,我认为这将成为副驾驶员的通用界面。他们还谈到了一种有趣的情景,就是通过提供一些提示来创建NPC。比如说,"嘿,我正在建设一个历史宪法的场景。我希望乔治·华盛顿在那里,但我希望他在最高程度上表现出礼貌,并且能够引导新用户进行体验,给他们一些关于宪法历史的介绍,并在完成后离开。" 我们相信,你将会看到这种形式的辅助。Jon认为这是一个令人难以置信的例子,因为有什么比直接与那些参与历史场景或时代的人交谈更好的学习历史的方式呢?你可以真正体验到这种方式如何推动教育...

我们还讨论了与朋友一起去古罗马的交流方面。你将会去到古罗马,大部分你会与历史上的人物进行互动,这些人物将尽可能真实地呈现,以丰富你的体验。这将是非常迷人的!

NPC作为副驾驶员的概念将为我们的游戏体验带来全新的可能性,不仅可以帮助新手玩家更好地上手,还能丰富教育和历史体验。我们迫不及待想要看到这个概念的进一步发展了!

VR和空间计算(spatial computing)

最近有个消息引起了我的注意,Roblox应用在Meta Quest平台上的beta版本仅仅在前五天就实现了100万次下载,这还不包括正式版在Oculus Store上的下载量。这让我对VR和空间计算产生了很多想法。我们知道,当iPhone发布的时候,它带来了一个革命,让我们可以在小屏幕上消费2D HTML内容,而不再局限于大屏幕的网页浏览。

现在我们已经习以为常了,但是我们的孩子可能根本意识不到10年前还有一种叫做"手机网页"的落后东西。

同样的,我认为3D也是如此。它是云端中的沉浸式多人体验,是模拟的3D世界。正因为如此,每个设备都有其最佳的相机和用户交互方式,并且具有不同的沉浸程度。你的手机可能不如VR头盔那么沉浸,但是手机更加便捷。

我们认为市场最终会决定你使用哪种设备来消费这些内容。我们并不试图改变市场,但我们希望能够出现在每个地方,以便与我们的玩家一起见证市场的变化。

我们过去的做法之一是,我们的所有3D工程师都在使用糟糕的Android设备作为主要测试设备,这对于Oculus的开发非常有帮助。我不是说这是一款糟糕的Android设备,但是它需要渲染两个眼睛的画面,这在技术上是具有挑战性的。通过我们高性能的基础设施,而不是仅仅依赖16个核心,我们能够应对这个挑战。

很令人兴奋的是,未来可能会针对不同的设备优化不同类型的体验。比如,你可以在电脑上使用鼠标和键盘玩经营游戏,然后在VR头盔中玩第一人称射击游戏。你可以选择合适的设备来玩游戏。

好了,接下来是一个有趣的快问快答环节。首先是,你最喜欢的书是什么?Dave回答是《无限游戏》(Infinite Game)。

接下来是,你最喜欢的游戏是什么?Dave回答是国际象棋。

然后是,你从导师、朋友或其他人那里得到的最好的建议是什么?

Dave说他小时候没有得到很多好的建议,他父亲给他的最糟糕的建议是"你应该学会会计和商业"。他给大家的一般建议是:我觉得我的前两份工作是灾难,但是生活是漫长的。如果你找到了一件你非常擅长并且热爱的事情,那就是最佳的选择。不要追随你的激情,也不要追随你擅长的事情。如果你能够将这两个方面结合起来,那就是最理想的选择。

最后一个问题,你对未来5年世界的发展有什么疯狂的预测?

Dave提出了一个关于人工智能的图灵测试问题。如果我们将AI应用于1633年的信息,并让它预测太阳系中是地球还是太阳居中,尽管99.9%的信息都在说地球居中,但我认为在5年内AI可能会选择太阳。如果是10年的话,Dave认为AI会选择太阳。

非常感谢大家收听,这真是一次愉快的讨论!希望你们喜欢今天的内容。记得继续关注我们的播客,我们会为你们带来更多有趣的话题。

我是你们的播客主播:MixCopilot 混合副驾,我们下次再见!

原文视频

https://youtu.be/RirqAH2m1HY

生成式人工智能的"经济学",The Economic Case for Generative AI#a16z

我们将抵达"终点"?Where We Go From Here#a16z#openai

figma+ChatGPT,人人都是设计师#设计开放·开源#Democratizing Design#a16z

相关推荐
埃菲尔铁塔_CV算法15 分钟前
深度学习神经网络创新点方向
人工智能·深度学习·神经网络
艾思科蓝-何老师【H8053】34 分钟前
【ACM出版】第四届信号处理与通信技术国际学术会议(SPCT 2024)
人工智能·信号处理·论文发表·香港中文大学
weixin_452600691 小时前
《青牛科技 GC6125:驱动芯片中的璀璨之星,点亮 IPcamera 和云台控制(替代 BU24025/ROHM)》
人工智能·科技·单片机·嵌入式硬件·新能源充电桩·智能充电枪
学术搬运工1 小时前
【珠海科技学院主办,暨南大学协办 | IEEE出版 | EI检索稳定 】2024年健康大数据与智能医疗国际会议(ICHIH 2024)
大数据·图像处理·人工智能·科技·机器学习·自然语言处理
右恩1 小时前
AI大模型重塑软件开发:流程革新与未来展望
人工智能
图片转成excel表格2 小时前
WPS Office Excel 转 PDF 后图片丢失的解决方法
人工智能·科技·深度学习
程序员洲洲2 小时前
重构开发之道,Blackbox.AI为技术注入智能新动力
chatgpt·blackbox.ai·blackboxai·图片转应用
ApiHug2 小时前
ApiSmart x Qwen2.5-Coder 开源旗舰编程模型媲美 GPT-4o, ApiSmart 实测!
人工智能·spring boot·spring·ai编程·apihug
哇咔咔哇咔3 小时前
【科普】简述CNN的各种模型
人工智能·神经网络·cnn
李歘歘3 小时前
万字长文解读深度学习——多模态模型CLIP、BLIP、ViLT
人工智能·深度学习