科技

Genie 3 是游戏中最令人兴奋的 AI 技术飞跃

Avatar photo
A person faces floating rocks and a massive waterfall in a surreal game scene, created with the World model AI Genie 3

Google DeepMind 的 Genie 3 就像游戏玩家的梦想一样 – 一种可以创建整个世界的 AI,只需描述一下就可以进入这个场景,探索每一个角落,就像它是专门为你设计的关卡一样。不需要预先制作的地图,不需要加载切换场景 – 只有一个活生生的世界,它会根据你的移动做出反应。

更令人惊讶的是,这些世界有多么灵活。它们不局限于一种风格或主题,并且它们记得你在其中做了什么。添加新的事件或角色,并且可以在不中断的情况下添加新的事件或角色,你开始看到这项技术可能如何改变我们对游戏的思考方式。Google 分享的演示看起来很疯狂。对于任何曾经想看到想象力变成可玩世界的人来说,这是我们迄今为止最接近的实现。

什么是 Genie 3?

在其核心,Genie 3 是 DeepMind 所谓的“通用世界模型”。这基本上意味着一种可以模拟世界行为并生成新世界的 AI。它不输出静态图像或短视频,而是创建一个你可以交互的整个环境。

这是 DeepMind 的 Genie 项目的第三个版本,它远远领先于 Genie 1 和 2。早期版本只能处理短的、低分辨率的序列,并且帧之间有明显的间隔。Genie 3 则可以在 720p 和 24fps 下平滑运行,环境可以保持一致几分钟。这可能不像现代游戏引擎那样令人印象深刻,但对于一个即时生成一切的模型来说,这是一个巨大的飞跃。

使这个版本脱颖而出的,是它如何跟上你的步伐。每一步,每一个相机转动,每一个新角度你看到了,都会实时生成,几乎就像系统正在预测从那个角度看世界应该是什么样子。Google 的 Genie 3 也不会依赖预先构建的资产或地图。它从头开始构建自己的世界,学习已经生成的内容的上下文。这就是为什么它可以无缝地从广阔的户外景观转到详细的室内空间,而不会破坏流畅性。

Genie 3 AI 与其他世界模型的不同之处

你可能会想,“我们已经看到 AI 生成图像、视频片段,甚至其他世界模型 – 什么使 Genie 3如此特别?”像 Midjourney 这样的工具可以创建惊人的视觉效果,但它们只能生成静态快照。它们不会给你一个可以移动的空间。在另一方面,像 Tencent 的 Hunyuan WorldOdyssey 这样的新实验已经展示了有前途的步骤,朝着交互式 AI 生成空间迈进,它们的输出看起来相当不错。然而,Genie 3 与其他模型的区别在于,它如何将一切联系在一起 – 不仅仅是生成一个场景,而是将其转化为一个对你在实时中的反应做出响应的世界。

真正的飞跃在于持久性和灵活性。Genie 3 有世界记忆,这意味着你采取的行动不会在你看向别处时消失。画一堵墙,留下一个标记,它就会保持在那里。它还支持可提示的事件,允许你在不中断的情况下添加新角色、天气变化或设置更改。其他模型可能暗示交互性,但 Genie 3 AI 感觉更接近一个适当的游戏引擎,拼接出响应你的移动的空间。

Genie 3 是否可以取代传统游戏?

这是每个游戏玩家都在思考的问题。简短的答案是:还不行。长答案是:也许有一天,在某些方面。

潜力是巨大的。想象一下,不需要扩展包或 DLC 来获得新地图 – 你只需描述一下,世界就会生成。无限重玩性。独立开发者可以瞬间原型化关卡,或者甚至让玩家通过实时输入提示来塑造自己的冒险。

但是,目前还有一些限制。Genie 3 的世界只能持续几分钟,然后一致性就会下降。虽然视觉效果令人印象深刻,但仍然不如精致的 AAA 质量。目前还没有声音,复杂的 NPC 行为 也还没有实现。你可以行走和以简单的方式交互,但你不会很快就能玩到一个由 Genie 完全生成的对话树和任务的深度 RPG。

所以,传统游戏不会消失。讲故事、紧密的机制、多人游戏平衡 – 这些仍然需要人类设计。Deepmind 的 Genie 3 可能会为副内容、快速实验或全新的类型提供动力,同时手工制作的标题继续占据主导地位。然而,在未来?如果这项技术成熟,我们可能会看到混合了人工创作内容和无限 AI 生成探索的游戏。并且,这很令人兴奋。

你现在可以访问 Genie 3 AI 吗?

到现在,你可能已经很想尝试一下。问题是,你还不能下载或使用 Genie 3,因为它还没有公开提供测试。DeepMind 只将其作为研究预览,仅向选定的学者和创作者提供有限的访问权限。对于我们其他人来说,唯一的方式是通过 Google 在其博客和 YouTube 上发布的演示来查看它的实际效果。这个演示仍然值得观看,因为它展示了该系统的灵活性和响应性。

DeepMind 表示,他们将逐渐扩大访问权限,但他们正在慢慢进行。这是有道理的。像这样的强大系统需要经过测试、安全检查和反馈,然后才能更广泛地开放。如果你想保持更新,关注 DeepMind 的博客或公告 是最好的方式。

Amar 是一位游戏爱好者和自由撰稿人。作为一位经验丰富的游戏内容撰稿人,他总是了解最新的游戏行业趋势。当他不忙于撰写引人入胜的游戏文章时,你可以找到他作为一位资深游戏玩家在虚拟世界中占据主导地位。