机器之心报道
编辑:Panda、冷猫
说是 GTA 6 又跳票到明年了。
作为开放世界游戏的标杆,GTA 系列不仅在游戏圈声名赫赫。尤其是在 AI 驱动的视频生成、三维生成或是世界模型等领域里,研究者们不仅采用游戏内场景为训练数据,更将生成类 GTA 的完整世界作为长久以来的目标。
但 GTA 6 的难产已经成为一个过不去的梗,大家总是在调侃:用 AI 做个 GTA 比 GTA 6 发布还快,就比如我们之前报道过的 Decart AI。
但真的要用 AI 做一个 GTA 出来,一个游戏引擎是必不可少的。一个多月前,我们报道过全球首个由实时世界模型驱动的 AI 原生 UGC 游戏引擎 Mirage。
在当时,我们拿公司附近的照片测试了一下场景生成的效果,很难说尽如人意。
<video class="" playsinline="true" x5-playsinline="true" webkit-playsinline="true" tabindex="2" mediatype="video" src="https://v26-web.toutiaovod.com/20a593e2cf4d4e9b8c0a6b5e6efb9e48/68a83bbd/video/tos/cn/tos-cn-ve-e5b010/oMNsLVD1QFJgIjBqEgENMU5UAtCqfh1QoofVgy/?a=24&ch=0&cr=0&dr=0&er=0&cd=0|0|0|0&br=1733&bt=1733&cs=0&ds=4&ft=hGkwBy6LRR0siqC5NDv2Nc0iPMgzbLZ.KxdU_4gmPRiJNv7TGW&mime_type=video_mp4&qs=0&rc=NWVpZTc3NGVkaTYzaDgzZEBpM3NlZ3A5cmc1NTUzNDs6M0AzLmEvXzUxX2IxYjItYmBhYSMuYDBnMmRjZGhhLS1kNmFzcw==&btag=80000e00020000&dy_q=1755852158&feature_id=59cb2766d89ae6284516c6a254e9fb61&l=20250822164238CEEAAFDDA614505FE208"></video>
不支持的音频/视频格式
请试试刷新
<button type="button" class="xg-icon-play"></button>
<svg xmlns="http://www.w3.org/2000/svg" class="xgplayer-replay-svg" viewBox="0 0 78 78" width="78" height="78">
</svg>重播
<button type="button" class="xg-icon-play"></button><button type="button" class="xg-icon-pause"></button>
播放
00:00
/
00:00
直播
<button type="button" class="xg-get-fullscreen"></button><button type="button" class="xg-exit-fullscreen"></button>
进入全屏
<button type="button" class="xg-volume-small"></button><button type="button" class="xg-volume"></button><button type="button" class="xg-volume-mute"></button>
50
<svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 20 20">
</svg>
<button type="button" class="xg-icon-play"></button><button type="button" class="xg-icon-pause"></button>
但谁能想到,仅仅过了一个多月,Mirage 就再一次迭代进化,发布了更强大、更灵活、更智能的 Mirage 2。
Dynamic Labs 称它为生成式世界引擎 —— 不仅仅是为游戏而生,而是为任何你能想象的互动世界。
「从 Mirage 1 到 Mirage 2,仅仅一个月,我们没有停下脚步,而是加速前进。」
他们号称,如果 Mirage 1 展示了一个类似 GTA 世界模型的潜力,那么 Mirage 2 是一款通用领域的世界模型,能让你即时创造、体验和改变任何游戏世界。
和 Mirage 1 一样,Mirage 2 同样支持上传图片,将其转换成可交互的游戏世界。Mirage 2 也支持实时对话,在游戏过程中随时通过文本指令修改游戏世界。在这一次,Mirage 支持生成的游戏场景通过视频进行分享。
Mirage 2 在生成性能上有了明显的进步。通过架构革新,它实现了:
- 更灵敏的提示控制:你的想法更快落地,画面更精准。
- 更低的游戏延迟:操作更顺畅,等待更少,沉浸感更强。
- 通用领域建模:不限题材,任何风格的世界都能实现。
在上一次,Mirage 仅发布了两款可玩的 demo,一个是 GTA 城市风格,另一个是竞速风格。
这一次打开 demo 页面,与 Mirage 1 的交互基本一致,他们把 UI 做的精致了不少。重点是,Mirage 2 显著突出了各种完全不同风格的场景可选。
咱们举几个和传统的城市风格完全不一样的,比较跳脱的例子:
吉卜力风格:村庄任务
儿童画:彩色城市
繁星之夜
除此以外,Mirage 2 能够实现在交互过程中通过文本指令来修改世界:
<video class="" playsinline="true" x5-playsinline="true" webkit-playsinline="true" tabindex="2" mediatype="video" src="https://v6-web.toutiaovod.com/528e90d1de75e2874531ae9ad11b933d/68a83bb1/video/tos/cn/tos-cn-ve-e5b010/oMDeNEwQhEKqCFw5FC3fyiDdWrJLBhgOooICJA/?a=24&ch=0&cr=0&dr=0&er=0&cd=0|0|0|0&br=2147&bt=2147&cs=0&ds=4&ft=WbaUMqBrffPdO.~SN1jNvAq-antLjrKo~EfCRkaJNdDGejVhWL6&mime_type=video_mp4&qs=0&rc=aTg4OjVnNWQ8ZDk7M2hnNUBpajhkcXI5cmo1NTUzNDs6M0AwX180M15hX18xYjZeYi9jYSMyamgwMmRrZGhhLS1kNi9zcw==&btag=c0000e00018000&dy_q=1755852158&feature_id=59cb2766d89ae6284516c6a254e9fb61&l=20250822164238052672F3A6D73FDE7305"></video>
不支持的音频/视频格式
请试试刷新
<button type="button" class="xg-icon-play"></button>
<svg xmlns="http://www.w3.org/2000/svg" class="xgplayer-replay-svg" viewBox="0 0 78 78" width="78" height="78">
</svg>重播
<button type="button" class="xg-icon-play"></button><button type="button" class="xg-icon-pause"></button>
播放
00:00
/
00:00
直播
<button type="button" class="xg-get-fullscreen"></button><button type="button" class="xg-exit-fullscreen"></button>
进入全屏
<button type="button" class="xg-volume-small"></button><button type="button" class="xg-volume"></button><button type="button" class="xg-volume-mute"></button>
50
<svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 20 20">
</svg>
<button type="button" class="xg-icon-play"></button><button type="button" class="xg-icon-pause"></button>
有了对广泛不同风格的场景支持,Mirage 2 似乎已经有了与 DeepMind 最新的 Genie 3 世界模型叫板的底气。相比于 Genie 3,Mirage 2 能够实现跑、跳、攻击等动作,十分钟以上的交互时间,200ms 的延迟水平,并能在单个消费级 GPU 上运行。但 Mirage 2 最大的不同是:它已经上线可以立即体验。
- 感兴趣的读者可以体验一下:https://demo.dynamicslab.ai/chaos
机器之心自然也上手测试了一下,和测试 Mirage 1 的时候一样,我们还用了同一张公司附近的照片上传测试,导出视频如下:
<video class="" playsinline="true" x5-playsinline="true" webkit-playsinline="true" tabindex="2" mediatype="video" src="https://v3-web.toutiaovod.com/dd1f01b326a2dc031fb9c1bdc361e22c/68a83bc2/video/tos/cn/tos-cn-ve-e5b010/o0lI4Ue9Q8szajUC8Q9GeBUDCVTLg6FATfERIT/?a=24&ch=0&cr=0&dr=0&er=0&cd=0|0|0|0&br=1545&bt=1545&cs=0&ds=4&ft=hGkwBy6LRR0s~dC52Dv2Nc.xBiGNbLZ.KxdU_4S1XwTJNv7TGW&mime_type=video_mp4&qs=0&rc=Zjs6ODo1NWdpZWYzM2RmOkBpM3hya3U5cmw1NTUzNDs6M0BhMDMzYDQtNl4xXmI1MWIvYSMycjQ0MmRrZGhhLS1kNmFzcw==&btag=c0000e00020000&dy_q=1755852158&feature_id=59cb2766d89ae6284516c6a254e9fb61&l=202508221642374FD7E8982C66CC0C6821"></video>
不支持的音频/视频格式
请试试刷新
<button type="button" class="xg-icon-play"></button>
<svg xmlns="http://www.w3.org/2000/svg" class="xgplayer-replay-svg" viewBox="0 0 78 78" width="78" height="78">
</svg>重播
<button type="button" class="xg-icon-play"></button><button type="button" class="xg-icon-pause"></button>
播放
00:00
/
00:00
直播
<button type="button" class="xg-get-fullscreen"></button><button type="button" class="xg-exit-fullscreen"></button>
进入全屏
<button type="button" class="xg-volume-small"></button><button type="button" class="xg-volume"></button><button type="button" class="xg-volume-mute"></button>
50
<svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 20 20">
</svg>
<button type="button" class="xg-icon-play"></button><button type="button" class="xg-icon-pause"></button>
这次我们给了一些详细的 Prompt,效果和上一次对比简直是飞跃。
不仅显著改善了 Mirage 1 物体比例的问题,加强了场景理解,场景的精度也有了明显的改善。人和车的模型明显变得更加合理,车流已经明显有了 GTA 4 的既视感。
虽然在线体验时的延迟非常高,人物灵敏度和上次对比感知不到明显改善,但是导出的视频比较流畅。
在 Mirage 1 发布时,团队成员 Zhiting Hu 表示推理时间约为 700ms,在 Mirage 2 上显著改善至 200ms,并且 Dynamics Lab 表示仍然有进一步加速的空间。
尽管 Mirage 2 在生成式世界建模方面取得了重大进展,但仍有一些技术问题:
- 动作控制精度:角色的操作还不够完美,比如在右转等动作上,偶尔会出现响应偏慢的情况。
- 视觉一致性:在快速切换场景时,可能会出现细节上的意外变化。不过,通过合理的提示工程(prompt engineering),可以在较长时间内保持画面一致性。
我们试玩下来感知最明显的就是视觉一致性的问题。在上面的测试视频中有两点可以明显看出世界一致性不足的问题:当操作的主角走过电瓶车的人,视角被遮挡后,我们操作的主角莫名其妙的变成了骑电瓶车的人;视角回转时,照片中的建筑物已经完全不是原先的样子了。
这种效果与 Genie 3 的演示的一致性效果相差甚远,正如读者在 Mirage 1 的报道下评论的那样:
不过,虽然仍然存在这些亟待解决的问题,仅仅过了一个多月,Mirage 就已经取得了如此进步,距离 GTA 6 发售还有九个月,到时候这些 AI 驱动的 UGC 游戏引擎又会发展到哪一步呢?
参考链接:
https://blog.dynamicslab.ai/
文中视频链接:https://mp.weixin.qq.com/s/f4hxFkE5HoTL7Eel8pslmQ