阿里出手了,这次是"造世界"!

你好,我是袋鼠标帝

我记得,第一次看《头号玩家》是大学的时候,在电影院。

具体哪一年我都忘了。但散场的那种感觉到现在还很清楚:那部电影直接点亮了我心底的一个梦。

主要是它那个设定太狠了:你戴上一个设备,就能走进任何一个世界,做任意角色的自己。

可以是赛车手。可以是侠客。可以是闯进《闪灵》酒店的探险者。

我一直觉得人生在于体验,不过这看起来太遥远了,所以这个梦只能一直放在心底。

直到前天,我看到阿里 ATH 团队又发布了一款叫HappyOyster(快乐生蚝)的世界模型应用。让我看到了实现头号玩家的希望。 www.happyoyster.cn/

看完宣传片,我直接就兴奋了!

于是我第一时间申请到了内测资格,然后试了一整天。

我感觉,头号玩家,在我有生之年,真的可能实现!

先带你看一个我造的世界。

末世废土

废土造出来的那一刻,第一感觉这不是一段视频。这也不是一张地图。

它是一个"活"的世界。

我按W往前,废墟从我身边掠过,按转身看见侧后方一片建筑废墟;抬头,天空清晰可见,低头是皲裂的地面。

这是我第一次用一句话,就造了个开放世界,并且还能实时控制主角。

接下来我又尝试了更炫酷的史诗奇幻风格

以及武侠风~都能轻松驾驭。

你可能会说:这不就跟开放世界游戏(比如GTA5、塞尔达)一样吗?我也可以在里面到处跑啊。

还真不太一样。

开放世界游戏的世界是做好的,它是一张被精心搭建过的固定地图,所有元素都被工程师摆在那里,你只是在里面走动而已。

据说GTA5花了5年时间打造,而GTA6,十多年过去了,还没问世...

但HappyOyster的世界是你自己造出来的(一分钟不到),画面是跟着我的动作实时生成的,没有一张提前做好的地图。

你转头,世界就转。

你按W,前方的画面就往前长一段。

你抬头看天空,天空的细节就跟着出来。

有那一秒钟脑海里闪过《头号玩家》绿洲的感觉。

老实讲,作为产品早期阶段,分辨率还在720p、单次只能漫游1分钟,画面也还不算多惊艳。

但那种"言出法随造世界,世界跟着我转"的感受,是文生视频和开放世界游戏都给不了的。

世界模型到底是什么?跟 Seedance2.0 等视频模型有什么区别?

文生视频模型=看电影 你写prompt,AI给你生成一段成片。 你从头到尾只能看,片子出来就死了。想改剧情?只能重新生成一遍。

世界模型≈实时造世界 没有提前做好的画面,世界是你给Prompt之后,实时造出来的。

它有空间、有物理、有声音。你既是玩家,也是这个世界的创造者。它会跟随你的意志而实时变化。

HappyOyster这款世界模型应用,有导演(Directing)模式:你可以像导演一样,用自然语言实时改变这个世界的剧情和走向。下雪、起风、让角色做某个动作,你说一句,世界就跟着改一次。

据我所知,一般的世界模型应用只有导演模式的玩法。

但这次阿里的HappyOyster除了导演模式外,还支持了Wandering(漫游)模式,也就是你可以先用prompt创建世界,然后可以像开放世界游戏那样,用WASD自己控制方向去探索(开头的案例就是)~

另外,除了自己造世界外,在HappyOyster上面还可以进入别人造的世界

比如进入别人造的滑雪世界,可以看到,还是有一点点延迟(1~2秒之间),但其实现阶段来说,反应已经算快了,因为正常视频模型生成一段视频都还是分钟级。

接下来看看导演模式(Directing)

不知道你玩没玩过《生化危机》系列。

我自己喜欢玩带点恐怖氛围的游戏,那种不知道下一个转角会冒出来什么的紧张感、那种低频压抑的环境音、那种压着一口气往前走的剧情,是我放松的方式之一。玩多了其实会上头😂

所以看到HappyOyster出来,我就想能不能自己做一段类似生化危机那种画面?

我在脑子里先设定想好:

主角在末世的街道上走着,一边要担心随时可能冒出来的丧尸,一边还要做任务找到幸存者。

剩下的交给Directing去推。

整个视频做的的过程我忘记录屏了,但是做好的画面你也可以直接下载,就是下载之后人声和物体碰撞声会消失,只有背景音乐在。这里要给阿里提个bug了。

这个有点🐂啊,首先实时指令遵循能力强,画面和音效、BGM匹配度贼高,整个世界看起来也比较真实,环境、人物一致性保持的不错,就是清晰度差点,偶尔会出现一些bug镜头,但我觉得了不掩瑜,已经是超出过非常好的世界模型应用了。

我们这代人见证了文字生成 → 图像生成 → 视频生成

下一个就是 世界生成,这应该也是AIGC的下半场。

目前世界模型还在非常早期。

不过这个赛道一旦成熟,吃掉的不只是视频模型的市场:游戏概念设计、影视预演、文旅展示、甚至是百味人生的大块需求。

Google有 Genie3,字节有World Labs,阿里这次入场,方向对了,但产品还是抢先体验阶段。

但方向对了,比什么都重要。

「最后」

老实讲,HappyOyster现在还远不是"绿洲"。

分辨率不够高(最高720p)、Wandering单次1分钟,Directing最长20分钟,物理细节还差点意思,Wander和Direct还没完全融合。

但我试完一天之后,真的第一次产生了「有生之年,我能实现头号玩家」的感觉。

我非常看好这个方向,也非常感兴趣

等我六七十岁的时候,这一类产品一定早就成熟了。

到让我能自定义一个完全真实的虚拟世界走进去。

走进年轻时候去过的那条街。

再见一次想见的人。

活一遍另一个版本的自己。

这些事,会变成现实。

HappyOyster 这个名字,来源是莎士比亚那句话: The world is your oyster(世界是你的牡蛎,等你亲手打开)

这颗牡蛎,刚撬开一条缝。

但缝里透出来的光,预示着希望✨

感兴趣的朋友,可以去官网申请waitlist: www.happyoyster.cn/

如果给一次创世的机会,你想打造一个什么样的世界?欢迎评论区分享~

我是袋鼠帝,一个致力于帮你把AI变成生产力的博主,我们下期再见

相关推荐
刘国华-平价IT运维课堂3 分钟前
Ubuntu 26.04 LTS 发布,研发与运维需要关注什么?
linux·运维·服务器·人工智能·ubuntu
专注搞钱4 分钟前
半导体行业中基于 LSTM 神经网络的 SPC 异常预测实战
人工智能·rnn·lstm
糖果店的幽灵5 分钟前
Spring AI 从入门到精通-ChatClient你与 AI 对话的终极武器
人工智能·python·spring
蓝速科技5 分钟前
蓝速科技丨立式全面屏 AI 数字人交互一体机落地实战指南
人工智能·科技·交互
暮雪倾风6 分钟前
【AI】CC switch安装与使用教程:告别繁琐配置,解锁 AI 编程 CLI 一键管理
人工智能·chatgpt·claudecode·ccswitch
linge_sun6 分钟前
Sping AI 使用 Ollama 快速搭建本地知识库
java·人工智能·ai编程
Cloud_Shy6189 分钟前
解读《Effective Python 3rd Edition》:从练气到老魔(第四章 Item 25 - 26)
开发语言·人工智能·经验分享·笔记·python·学习方法
KaMeidebaby10 分钟前
卡梅德生物技术快报|抗原如何自己检测?FAdV-4 重组抗原制备与 ELISA 体系技术调试指南
前端·人工智能·物联网·算法·百度
呆呆敲代码的小Y10 分钟前
Understand Anything入门指南: 代码库、知识库 转化为交互式知识图谱
人工智能·ai·知识图谱·知识库·代码库·understand
fthux11 分钟前
「装闭」-AI驱动的开源装修闭坑系统
人工智能·docker·开源